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Toxine insecticide de Bacillus thuringiensis modifiee 

sensible a la pepsine 



La presente invention concerne la degradation des proteines Cry de Bacillus thuringiensis 
dans le tractus digestif des mammiferes. Elle a pour objet des proteines Cry de Bacillus 
thuringiensis dont la sequence peptidique a ete modifiee de maniere a les rendre sensibles aux 
enzymes specifiques du tractus digestif des mammiferes, en particulier aux pepsines. Selon cette 
invention, les proteines Cry sont modifiees par insertion de sites de coupure par la pepsine dans 
leur sequence peptidique. L f invention concerne egalement des plantes transformees exprimant 
ces proteines Cry modifiees. , 

Les bacteries de Tespece Bacillus thuringiensis (ci-apres Bt) sont bien connues pour les 

T 

toxines insecticides qu'elles produisent. Ces bacteries a Gram-positif forment un cristal proteique 
parasporal au cours de leur phase de croissance stationnaire, lequel cristal est largement 
responsable de leur activite insecticide. Le cristal de ces bacteries est constitue d'une toxine 
insecticide de nature proteique nommee proteine Cry et codee par un gene cry. De par ses 
proprietes insecticides, cette proteine Cry a ete employee en protection des cultures contre les 
insectes ravageurs, en tant que solution alternative aux insecticides de synthese. Actuellement, 
cette utilisation agronomique se realise essentiellement par deux methodes, l'epandage direct du 
produit en tant que biopesticide, et la transformation genetique des plantes cultivees avec un 
gene codant pour une proteine Cry. Selon les souches de Bt dont elles sont issues, les proteines 
Cry ont des activites insecticides vis-a-vis de spectres d'insectes differents. Les principaux ordres 
d'insectes contre lesquels sont actives les toxines Cry sont les Lepidopteres, les Coleopteres et 
les Dipteres, mais certaines toxines sont efficaces vis-a-vis d'autres ordres d'insectes. L'ensemble 
des proteines Cry isolees des differentes souches de Bt est rassemble dans une classification en 
fonction de leurs homologies de sequences, et un code leur est attribue afin de les distinguer 
(Crickmore et al, 1998, Microbiol. Molec. Biol. Review 62(3), 807-813). L'interet de I'utilisation 
de ces toxines en agriculture reside done dans leur specificite d'action vis-a-vis d'un ou de 
plusieurs ordres d'insectes donnes, mais aussi dans leur absence de toxicite vis-a-vis des 
mammiferes, des oiseaux, des amphibiens et des reptiles. 



Cette absence de toxicite vis-a-vis des mammiferes a permis le developpement de la 
culture de plantes transgeniques exprimant une proteine Cry et Tutilisation des graines de ces 
plantes pour Talimentation humaine et animale. Toutefois, bien que non toxiques vis-a-vis des 
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mammiferes, certaines de ces proteines sont peu degradees dans le tractus digestif des 
mammiferes, et cette absence de degradation conduit a une persistance relativement longue de la 
toxine dans le tractus digestif desdits mammiferes. En outre, l'absence de persistence des 
proteines Cry dans le tractus digestif des mammiferes est un des criteres pris en compte par les 
autorites administratives (par exemple, TAgence pour la Protection de l'Environnement - EPA - 
des Etats-Unis) delivrant des autorisations de mise sur le marche alimentaire de graines 
contenant ces proteines ou de produits issus de ces graines. 

La presente invention permet de pallier 1'inconvenient ci-dessus mentionne. Cette 
invention est basee sur le principe selon lequel la stabilite de certaines proteines Cry dans le 
tractus digestif des mammiferes serait due a une absence de sensibilite de ces proteines aux 
enzymes specifiques dudit tractus digestif, en particulier aux proteases. La solution a ce 
probleme reside done dans Integration artificielle de sites specifiques, propres aux enzymes du 
tractus digestif des mammiferes, dans la proteine Cry. La presente invention a done pour objet 
des proteines Cry modifiees sensibles aux enzymes specifiques du tractus digestif des 
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mammiferes, en particulier les proteases specifiques de Testomac des mammiferes, et plus 
particulierement les pepsines. La pepsine est une enzyme particuliere de la famille des proteases, 
et elle est majoritairement presente dans Testomac des mammiferes (95% des proteases 
stomacales). II s f agit d'une protease a site aspartique agissant a un pH optimum egal a 2. La 
pepsine est une enzyme de choix comme source de degradation des proteines Cry car elle n'est 
pas presente dans le tube digestif des insectes, en particulier des lepidopteres dont le pH du tube 
digestif est compris entre 10 et 1 1 (Terra, W. B. and C. Ferreira. 1994. Insect digestive enzymes : 
properties, compartimentalization and fixneition. Cbmp. Biochem. PhysioL 109B : 1-62.). Cette 
absence de pepsine chez les insectes est done une garantie que Tintroduction de sites specifiques 
a la pepsine dans les proteines Cry ne presente pas de risque d'augmentation de leur degradation 
dans le tube digestif des insectes. La presente invention est done une solution au probleme 
technique ci-dessus expose, a savoir une augmentation de la sensibilite des proteines Cry aux 
enzymes du tractus digestif des mammiferes, sans alteration des proprietes insecticides desdites 
proteines Cry. 

Toutefois, la proteine Cry est une proteine tres organisee dont la forme activee est 
composee de trois domaines, et dans laquelle les relations structure-fonction sont tres fortes dans 
et entre les domaines. Ce niveau d'organisation important des proteines Cry ne permet pas 
Tinsertion aleatoire de mutations dans la proteine. En effet, l'insertion de sites de coupure 
specifiques aux enzymes stomacales de mammiferes ne doit pas alterer les proprietes insecticides 
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des toxines. 

Les proteines Cry sont naturellement produites par la bacterie Bacillus thuringiensis sous 
forme de protoxines inactives. Le mode diction naturel de ees proteines implique la 
solubilisation du cristal proteique dans l'intestin de l'insecte, la degradation proteolytique de la 
protoxine liberee, la fixation de la toxine activee sur les recepteurs de l'intestin des insectes, et 
Tinsertion de la toxine dans la membrane apicale des cellules intestinales pour creer des pores ou 
canaux ioniques. La degradation proteolytique de la protoxine dans l'intestin des insectes est 
realist sous Taction conjuguee du pH alcalin et des proteases a sites serines (essentiellement la 
trypsine) du sue digestif (Schnepf et a/., 1998). 

Les toxines Cry sont constitutes de trois domaines structuraux, le domaine I, le domaine 
II et le domaine III. Le domaine I occupe environ la moitie N-terminale de la toxine activee. Les 
domaines II et III occupent environ chacun un quart de la toxine activee. Le domaine III est situe 
a Textremite C-terminale de la toxine activee. Chaque domaine de la proteine Cry possede sa 
propre structure et sa propre fonction. 

Le domaine I est constitue de sept helices alpha, 6 helices amphiphiles et une helice 
hydrophobe, reliees ehtre-elles par des boucles interhelices constitutes de quelques acides 
amines. Ce domaine est le domaine transmembranaire, responsable de la formation du pore ou 
canal ionique (Aronson et al, 1995 ; Chen et al, 1993 ; Manoj-Kumar et Aronson, 1999; 
Masson et al, 1999 ; Rang et al, 1999; Coux et al„ 1999). La formation du pore 
transmembranaire par les helices alpha du domaine I implique en fait quatre proteines Cry 
formant un pore complet avec leurs quatre helices alpha 4 respectives (Masson et al., 1999). II se 
forme done un pore cylindrique de quatre helices a 4. L'interieur de ce pore est constitue par les 
faces hydrophiles des helices amphiphiles, les residus charges negativement etant presents sur les 
faces hydrophiles, ils se retrouvent dans la lumiere du pore, en milieu aqueux et remplissent leur 
fonction de transport d'ions. L'exterieur du pore est constitue par les faces hydrophobes qui 
ancrent le pore dans la membrane lipidique. La formation du pore par les helices a du domaine I 
implique done des relations structure-fonction tres fortes et des changements de conformation au 
cours du temps. L'introduction de mutations dans les helices alpha du domaine I presente done 
une forte probabilite de perturbation de la fonction de ce domaine, et done de l'activite de la 
toxine. 
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Les domaines II et III de la toxine activee sont constitues de feuillets beta, eux aussi sous 
une forme tres compactee. Ces deux domaines sont impliques dans la reconnaissance du site 
recepteur (specificite) et dans la stabilite de la toxine (Abdul-Rauf et Ellar, 1999 ; Dean et aL y 
1996 ; Hussain et al, 1996 ; Lee et al., 1999 ; Rajamohan et al, 1996, 1998 ; Wu et Dean, 1996). 
Des echanges de domaines III induisent des changements de specificite (de Maagde/ al, 1999) . 
Cette region est beaucoup moins conservee, done plus variable que le domaine I. Elle est 
impliquee dans la specificite de chaque toxine. Cette variability et ces interactions propres a 
chaque toxine interviennent dans la nature du spectre d'hotes tres specifique de chaque toxine et 
sont impliques dans la reconnaissance de sites recepteurs differents. La reconnaissance du 
recepteur est effectuee par des boucles du domaine II et du domaine III et la conformation de ces 
boucles varie subtilement d'une toxine a Tautre en fonction de l'arrangement et des interactions 
entre les domaines II et III. Le domaine I interfere aussi avec les deux autres domaines et 
influence la conformation generate (Rang et al. 9 1999, 2001). En outre, tres peu de choses sont 
connues sur les relations structure-fonction au sein de ces deux domaines et aucune information 
n'est actuellement disponible sur la conformation necessaire a la reconnaissance d f un site 
recepteur. II est done tres difficile de presager des consequences de l'introduction de 
modifications dans les domaines II et III. sur la specificite, la capacite a reconnaitre les sites 
recepteurs et la toxicite des proteines Cry. Par ailleurs, on sait que des mutations generees dans 
les domaines II et III induisent tres souvent une destabilisation de la toxine chez Tinsecte, 
entraTnant une perte de toxicite. 

Des ponts salins existent egalement entre les domaines I et II des proteines Cry. Ces 
ponts jouent un role important dans la stabilite de la toxine et dans son fonctionnement. 
L f elimination artificielle de ces ponts chez CrylAal montre que les protoxines et toxines 
activees sont moins stables que la proteine parentale (Vachon et al., 2000). Ces ponts salins sont 
presents entre le domaine II et Thelice al du domaine I. L f importance reconnue de ces ponts 
laisse supposer que des mutations dans le domaine II et l'helice a7 du domaine I presentent un 
risque eleve de perturbation du fonctionnement des proteines Cry. 
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Description 



La presente invention concerne une proteine Cry modifiee sensible a la pepsine, 
caracterisee en ce qu'elle possede au moins un site de coupure par la pepsine additionneL 

Par proteine Cry, on entend la proteine insecticide produite par une souche de bacterie 
Bacillus thuringiensis (ci apres designee Bt), dont les differents holotypes existants et a venir 
sont references par le comite de classification de Bt (Crikmore, 2001) et accessibles sur le site 
Internet http://www > biols.susx.ac.uk/Home/Neil Crickmore/Bt/index.html . En particulier, cette 
proteine Cry est codee par un gene cry, soit naturellement par la bacterie Bt, soit de maniere 
recombinante dans un organisme hote transforme avec un gene cry ou avec un gene comprenant 
au moins la sequence codante d'une proteine Cry. Les proteines Cry selon invention 
comprennent egalement des> proteines Cry dont la sequence a ete artificiellement modifiee de 
maniere a augmenter leur afctivite insecticide ou leur resistance aux conditions de traitement. 
Cette definition inclus egalement des fragments de proteines Cry conservant Tactivite insecticide, 
telles que les proteines Cry tronquees ne comportant que la partie N-terminale d'une proteine Cry 
complete, en particulier le domaine I de cette proteine (WO 94/05771). Sont egalement 
comprises les proteines Cry fusionnees telles que decrites dans la demande de brevet 
intemationale WO 94/24264. De maniere preferee, la proteine Cry selon l'invention est 
selectionnee parmi les proteines Cryl, Cry3, Cry4, Cry7, Cry8, Cry9, CrylO, Cryl6, Cryl7, 
Cry 19, ou Cry 20. De manure preferentielle, il s'agit de la proteine Cry9C, et de preference la 
proteine Cry9Cal (Lambert et al., Appl. Environm. Microbiol. 62, 80-86; WO 94/05771). En 
particulier, la presente invention s'adapte egalement a toute proteine Cry dont la toxicite a ete 
amelioree, comme par exerriple celles decrites dans les demandes de brevets WO 97/498 1 4 ou 
WO 99/00407. 

Selon la presente invention, la proteine Cry est modifiee. On entend par proteine Cry 
modifiee, une proteine Cry dont la sequence peptidique est differente de la sequence de la 
proteine Cry native dont elle est issue. Cette difference de sequences est le resultat de 
modifications artificielles introduites par ingenierie gen6tique, notamment Tinsertion ou la 
substitution de residus acides amines specifiques dans ladite sequence peptidique. En particulier, 
la proteine Cry modifiee est produite par modification de la sequence nucleotidique la codant, 
notamment par la technique de mutagenese dirigee bien connue de Thomme du metier 
(Hutchinson C.A et al., 1978, J. Biol. Chem. 253: 6551). De maniere preferee, la modification de 
la proteine Cry consiste en une substitution de residus acides amines. 
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La proteine Cry modifiee selon Tinvention est sensible a la pepsine. La pepsine focalise 
son action proteolytique au niveau de sites de coupure specifiques constitues par les acides 
amines leucine, phenylalanine et Tacide glutamique. La proteolyse est realisee du cote 
C-terminal du residu concerne. Par sensible a la pepsine, on entend selon Tinvention la propriete 
pour la proteine Cry modifiee de subir une proteolyse par la pepsine. La proteolyse de la proteine 
Cry conduit a la perte partielle ou totale de Tactivite insecticide de ladite proteine. La sensibilite 
a la pepsine peut done se mesurer par mise en contact, de preference in vitro, d'une proteine Cry 
modifiee selon Tinvention avec une pepsine, puis mesure de la perte d'activite insecticide de 
ladite proteine Cry modifiee en comparaison avec une proteine Cry native, non modifiee selon 
Tinvention. A titre d'exemple, les tests decrits dans les exemples 7 et 8 peuvent etre employes 
pour mesurer la sensibilite a la pepsine d'une proteine Cry selon Tinvention. Alternativement, la 
technique du Western blot peut egalement etre utilisee pour mesurer ladite sensibilite a la 
pepsine. Par cette technique, la sensibilite est mesuree par Tobservation de la degradation 
structurelle de la proteine Cry modifiee apres contact avec une pepsine. Cette observation 
consiste en la disparition ou Tattenuation d'intensite d'une bande correspondant a la proteine Cry 

sur une membrane de transfer! d'un gel d'electrophorese par rapport a une proteine Cry native, 

» 

non modifiee selon Tinvention. La mise en oeuvre de ces techniques fait partie des connaissances 
generates de Thomme du metier. 

La proteine Cry modifiee selon Tinvention est caracterisee en ce qu'elle possede au moins 

* 

un site de coupure par la pepsine additionnel. Par "site de coupure par la pepsine", on entend un 
site constitue d'au moins un residu acide amine reconnu comme site de proteolyse par la pepsine. 
Les residus acides amines reconnus par la pepsine sont la leucine, phenylalanine ou Tacide 
glutamique. Par "site de coupure par la pepsine additionnel", on entend un site de coupure 
supplemental par rapport a la proteine Cry native telle que produite par la bacterie Bt, 

De maniere preferee, le site de coupure par ia pepsine additionnel est represente par un 
residu acide amine selectionne parmi les residus leucine, phenylalanine ou acide glutamique. 
Selon un mode particulier de realisation de Tinvention, la proteine Cry modifiee possede 
plusieurs sites de coupure par la pepsine additionnels representes par un meme residu acide 
amine. Selon un autre mode de realisation de Tinvention, la proteine Cry modifiee possede 
plusieurs sites de coupure par la pepsine additionnels representes par des residus acides amines 
differents. 



Selon un mode particulier de realisation de rinvention, la proteine Cry modifiee selon 
rinvention est caracterisee en ce qu'elle possede au moins un site de coupure par la pepsine 
additionnel dans au moins une des boucles inter-helices alpha du domaine I. Par boucles inter- 
helices alpha du domaine F, on entend les chaines peptidiques reliant les sept helices alpha du 
domaine I des proteines Cry telles que decrites dans Grochulski et al. (1995) et Li et al. (1991). 
Selon rinvention, la proteine Cry doit posseder au moins un site de coupure par la pepsine 
additionnel. En outre, Iedit site de coupure additionnel se trouve dans au moins une des boucles 
inter-helices alpha du domaine I. Le terme additionnel s'entend done comme supptementaire par 
rapport au nombre de sites de coupure par la pepsine naturellement presents dans les boucles 
inter-helices alpha du domaine I de la proteine Cry native telle que produite par la bacterie Bt. 
Cette definition signifie que la proteine Cry modifiee selon rinvention est caracterisee en ce 
qu'elle possede un nombre de sites de coupure par la pepsine dans ses boucles inter-helices alpha 
du domaine I sup6rieur au nombre de ces sites dans la meme proteine Cry native telle que 
produite par la bacterie Bt, la difference entre lesdits nombres etant au minimum egale a 1 . 

Selon un mode particulier de realisation de rinvention, la proteine Cry modifiee selon 

l'invention possede au moins un site de coupure par la pepsine dans la boucle inter-helices alpha 

i 

reliant les helices alpha 3 et 4 du domaine L 

Selon un mode de realisation prefere de rinvention, la proteine Cry modifiee est une 
proteine Cry9C modifiee. De preference, la proteine Cry modifiee est une proteine Cry9Cal 
modifiee, possedant un site de coupure par la pepsine positionne sur le residu acide amine 164. 
En particulier, le residu arginine naturellement present en position 164 sur la proteine Cry9Cal 
est remplace par un residu acide amine choisi parmi les residus leucine, phenylalanine ou acide 
glutamique sur la proteine Cry9Cal modifiee selon rinvention. De maniere preferee, la proteine 
Cry9Cal modifiee selon rinvention est selectionnee parmi les proteines Cry dont les sequences 
sont representees par les identificateurs SEQ ID NO:4, SEQ ID NO:6 ou SEQ ID NO:8. 

La presente invention concerne egalement une proteine Cry modifiee sensible a la pepsine, 
caracterisee en ce que les sites de coupure par la pepsine additionnels qu'elle possede sont 
introduits par substitution de residus acide aspartique par des residus acide glutamique, 
substitution de residus tryptophane par des residus phenylalanine, et substitution de residus 
valine ou isoleucine par des residus leucine. De preference, le taux de substitution que possede 
ladite proteine Cry modifiee est de 25%. Par taux de substitution, on entend le pourcentage de 
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residus acides amines de la proteine Cry native qui sont remplaces par des residus acides amines 
correspondant a des sites de coupure par la pepsine dans la proteine Cry modifiee de Tinvention. 

La presente invention a egalement pour objet un procede d'augmentation de la sensibilite a 
la pepsine des proteines Cry, caracterise en ce que Ton introduit au moins un site de coupure par 
la pepsine additionnel dans lesdites proteines Cry. Par "augmentation de la sensibilite a la 
pepsine des proteines Cry", on entend un accroissement de la sensibilite a la pepsine des 
proteines Cry obtenues par ledit procede par rapport aux proteines Cry natives correspondantes, 
cet accroissement se traduisant par une destruction proteolytique et une perte d'activite 
insecticide des proteines Cry, ces effets pouvant etre partiels ou totaux. 

L'introduction d'au moins un site de coupure par la pepsine est realisee de maniere 
artificielle par ingenierie genetique. En particulier, il s'agit d'une insertion ou d'une substitution 
de residus acide amines. De preference, il s'agit d'une substitution. Une telle substitution peut 
aisement etre realisee par la technique de mutagenese dirigee bien connue de Thomme du metier. 

De maniere preferee, la proteine Cry auquel s'applique le procede selon Tinvention est 
selectionnee parmi les proteines Cryl, Cry 3, Cry4, Cry 7, Cry 8, Cry 9, Cry 10, Cry 16, Cry 17, 
Cry 19, ou Cry 20. De maniere preferentielle, il s'agit de la proteine Cry9C, et de preference la 
proteine Cry9Cal. 

En particulier, le site de coupure par la pepsine additionnel est represents par un residu 
acide amine choisi parmi les residus leucine, phenylalanine ou acide glutamique. 

Selon un mode particulier de realisation de Tinvention, le procede selon Tinvention est 
caracterise en ce qu'au moins un site de coupure par la pepsine additionnel est introduit dans au 
moins une des boucles inter-helices alpha du domaine I de ladite proteine Cry. 

Selon un autre mode particulier de realisation de Tinvention, le procede selon Tinvention 
est caracterise en ce qu'au moins un site de coupure par la pepsine additionnel est introduit dans 
la boucle inter-helices alpha reliant les helices alpha 3 et 4 du domaine I. 

Selon un mode prefere de realisation de Tinvention, le present procede s'applique a une 
proteine Cry9C. De preference, il s'applique a une proteine Cry9Cal , et le site de coupure par la 
pepsine additionnel est introduit par substitution du residu acide amine 164. En particulier, le 
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residu arginine naturellement present en position 164 sur la proteine Cry9Cal est remplace par 
un residu acide amine choisi parmi les residus leucine, phenylalanine ou acide glutamique. 

La presente invention concerne egalement un precede d'augmentatiori de la sensibilite a la 
pepsine des proteines Cry, caracterise en ce que les sites de coupure par la pepsine additionnels 
sont introduits par substitution de residus acide aspartique par des residus acide glutamique, 
substitution de residus tryptophane par des residus phenylalanine, et substitution de residus 
valine ou isoleucine par des residus leucine. 

De maniere preferee, le taux de substitution introduit dans ladite proteine Cry est de 25 %. 

La presente invention concerne egalement un polynucleotide codant pour une proteine Cry 
modifiee selon Invention. Selon la presente invention, on entend par "polynucleotide" une 
sequence nucleotidique naturelle ou artificielle pouvant etre de type ADN ou ARN, de 
preference de type ADN, notamment double brin. 

La presente invention concerne egalement un gene chimere comprenant au moins, lies 
entre eux de maniere operationnelle, un promoteur fonctionnel dans un organisme hote, un 
polynucleotide codant pour une proteine Cry modifiee selon Invention, et un element 
terminateur fonctionnel dans ce meme organisme hote. Les differents elements qu'un gene 
chimere peut contenir sont, d'une part, des elements regulateurs de la transcription, de la 
traduction et de la maturation des proteines, tels qu'un promoteur, une sequence codant pour un 
peptide signal ou un peptide de transit, ou un element terminateur constituant un signal de 
polyadenylation, et d'autre part un polynucleotide codant pour une proteine. L'expression "lies 
entre eux de maniere operationnelle" signifie que lesdits elements du gene chimere sont lies entre 
eux de maniere a ce que le fonctionnement d r un de ces elements est affecte par celui d'un autre. 
A titre d'exemple, un promoteur est lie de maniere operationnelle a une sequence codante 
lorsqu'il est capable d'affecter l'expression de ladite sequence codante. La construction du gene 
chimere selon l'invention et l'assemblage de ses differents elements est realisable par l'emploi de 
techniques bien connues de l'homme du metier, notamment celles decrites dans Sambrook et al. 
(1989, Molecular Cloning : A Laboratory Manual, Nolan C. ed., New York: Cold Spring Harbor 
Laboratory Press). Le choix des elements regulateurs constituant le gene chimere est 
essentiellement fonction de l'espece hote dans laquelle ils doivent fonctionner, et Thomme du 
metier est capable de selectionner des elements regulateurs fonctionnels dans un organisme hote 
donne. Par "fonctionnels", on entend capables de fonctionner dans un organisme hote donne. 
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Selon un mode particulier de realisation de l'invention, le gene chimere contient un 
promoteur dit "constitutif. Un promoteur constitutif selon la presente invention est un 
promoteur qui induit l'expression d'une sequence codante dans tous les tissus d r un organisme 
hote et en permanence, c'est-a-dire durant toute la duree du cycle vital dudit organisme hote. 
Certains de ces promoteurs peuvent etre tissu-specifiques, c'est-a-dire exprimer la sequence 
codante en permanence, mais uniquement dans un tissu particulier de Torganisme hote. Des 
promoteurs constitutifs peuvent provenir de tout type d'organisme. Parmi les promoteurs 
constitutifs qui peuvent etre utilises dans le gene chimere de la presente invention, nous pouvons 
citer a titre d'exemple, des promoteurs bacteriens, comme celui du gene de Toctopine synthase ou 
celui du gene de la nopaline synthase, des promoteurs viraux, comme celui du gene controlant la 
transcription des ARN19S ou 35S du virus de la mosaique du Choux-Fleur (Odell et al., 1985, 
Nature, 313, 810-812), ou les promoteurs du virus de la mosaique de la nervure du Manioc (tels 
que decrits dans la demande de brevet WO 97/48819). Parmi les promoteurs d'origine vegetale 
on citera le promoteur du gene de la petite sous-unite de ribulose-biscarboxylase/oxygenase 
(RuBisCO), le promoteur d'un gene d'histone tel que decrit dans la demande EP 0 507 698, le 
promoteur du gene EFl-alpha (WO 90/02172), le promoteur d'un gene d'actine (US 5,641,876), 
ou le promoteur d'un gene d'ubiquitine (EP 0342926). 

! 
h 

I 

Selon un autre mode particulier de realisation de l'invention, le gene chimere contient un 
promoteur inductible. Un promoteur inductible est un promoteur qui ne fonctionne, c'est-a-dire 
qui n'induit l'expression d'une sequence codante, que lorsqu'il est lui-meme induit par un agent 
inducteur. Cet agent inducteur est en general une substance qui peut etre synthetisee dans 
l'organisme hote suite a un stimulus externe audit organisme, ce stimulus externe pouvant etre de 
nature physique ou chimique, biotique ou abiotique. De tels promoteurs sont connus, comme par 
exemple le promoteur du gene d'0-methyltransferase de classe II (COMT II) de plante decrit 
dans la demande de brevet WO 00/56897, le promoteur PR-1 d'Arabidopsis (Lebel et al., 1998, 
Plant J. 16(2):223-233), le promoteur EAS4 du gene de la sesquiterpene synthase du Tabac (Yin 
et al., 1997, Plant Physiol. 115(2), 437-451), ou le promoteur du gene codant la 3-hydroxy-3- 
methylglutaryl coenzyme A reductase (Nelson et al., 1994, Plant Mol. Biol. 25(3):401-412). 

Parmi les elements terminateurs pouvant etre utilises dans le gene chimere de la presente 
invention, nous pouvons citer a titre d'exemple l'element terminateur nos du gene codant la 
nopaline synthase d'Agrobacterium tumefaciens (Bevan et al., 1983, Nucleic Acids Res. 11(2), 
369-385), ou l'element terminateur d'un gene d'histone tel que decrit dans la demande EP 0 633 
317. 
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Selon uji mode particulier de realisation de I'invention, le promoteur et I'element 
terminateur du gene chimere selon I'invention sont tous les deux fonctionnels dans les plantes. 

II apparait egalement important que le gene chimere comprenne aussi un peptide signal ou 
un peptide de transit qui permet de controler et d'orienter la production de la proteine Cry de 
maniere specifique dans un compartiment cellulaire de Torganisme hote, comme par exemple le 
cytoplasme, un compartiment particulier du cytoplasme, la membrane cellulaire, ou dans le cas 
des plantes dans un type particulier de compartiments cellulaires, par exemple les chloroplastes, 
ou dans la matrice extracellulaire. 

Les peptides de transit peuvent etre soit simples, soit doubles. Les peptides de transit 
doubles sont eventuellement separes par une sequence intermediate, c'est-a-dire qu'ils 
comprennent, dans le sens de la transcription, une sequence codant pour un peptide de transit 
d'un gene vegetal codant pour une enzyme a localisation plastidiale, une partie de sequence de la 
partie mature N-terminale d'un gene vegetal codant pour une enzyme a localisation plastidiale, 
puis une sequence codant pour un second peptide de transit d'un gene vegetal codant pour une 
enzyme a localisation plastidiale. De tels peptides de transit doubles sont par exemple decrits 
dans la demande de brevet EP 0 508 909. 

Comme peptide signal utile selon I'invention, on peut citer en particulier le peptide signal 
du gene PR- la du tabac decrit par Comelissen et al. (1987, Nucleic Acid Res. 15, 6799-681 1) en 

* 

particulier lorsque le gene chimere selon I'invention est introduit dans des cellules vegetales ou 
des plantes. 

La presente invention concerne egalement un vecteur contenant un gene chimere selon 
Tinvention. Un tel vecteur est utile pour transformer un organisme hote et exprimer dans celui-ci 
une proteine Cry modifiee selon I'invention. Ce vecteur peut etre un plasmide, un cosmide, un 
bacteriophage ou un virus. De maniere generate, les principles qualites de ce vecteur doivent 
etre une capacite a se maintenir et a s'autorepliquer dans les cellules de Torganisme hote, 
notamment grace a la presence d'une origine de replication, et a y exprimer une proteine Cry 
modifiee. Le choix d'un tel vecteur ainsi que les techniques d'insertion dans celui^ci du gene 
chimere selon Tinvention sont largement decrits dans Sambrook et al. (1989, Molecular Cloning 
: A Laboratory Manual, Nolan C. ed., New York: Cold Spring Harbor Laboratory Press) et font 
partie des connaissances generates de Thomme du metier. Le vecteur utilise dans la presente 
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invention peut egalement contenir, en plus du gene chimere de Tinvention, un gene chimere 
contenant un marqueur de selection. Ce marqueur de selection permet de selectionner les 
organismes hotes effectivement transformes, c f est-a-dire ceux ayant incorpore le vecteur. Parmi 
les marqueurs de selection utilisables dans de nombreux organismes hotes, on peut citer des 
marqueurs contenant des genes de resistance aux antibiotiques tel que celui du gene de 
l'hygromycine phosphotransferase (Gritz et ah, 1983, Gene 25:179-188). De maniere 
preferentielle, Torganisme hote a transformer est une plante. Parmi les marqueurs de selection 
utilisables dans les plantes, on peut citer des marqueurs contenant des genes de tolerance aux 
herbicides tel que le gene bar (White et ah, NAR 18:1062, 1990) pour la tolerance au bialaphos, 
le gene EPSPS (US 5,188,642) pour la tolerance au glyphosate ou encore le gene HPPD (WO 
96/38567) pour la tolerance aux isoxazoles. On peut egalement citer des genes codant pour des 
enzymes facilement identifiables comme 1'enzyme GUS, des genes codant pour des pigments ou 
des enzymes regulant la production de pigments dans les cellules transformees. De tels genes 
marqueurs de selection sont notamment decrits dans les demandes de brevet WO 91/02071 et 
WO 95/06128. 

La presente invention concerne egalement des organismes hotes transformes par un 
vecteur tel que decrit ci-dessus. Par organismes hotes, on entend tout type d'organismes, en 
particulier des plantes ou des microorganismes tels que les bacteries, les virus, les champignons 
ou les levures. On entend par "organisme hote transforme", un organisme hote qui a incorpore 
dans son genome le gene chimere de Tinvention, et produit en consequence une proteine Cry 
modifiee selon Tinvention dans ses tissus. Pour obtenir les organismes hotes selon Tinvention, 
l'homme du metier peut utiliser une des nombreuses methodes de transformation connues. Une 
de ces methodes consiste a mettre les cellules a transformer en presence de polyethylene glycol 
(PEG) et des vecteurs de Tinvention (Chang and Cohen, 1979, Mol. Gen. Genet. 168(1), Hi- 
ll 5; Mercenier and Chassy, 1988, Biochimie 70(4), 503~-5 17). L'electroporation est une autre 
methode qui consiste a soumettre les cellules ou tissus a transformer et les vecteurs de Tinvention 
a un champ electrique (Andreason and Evans, 1988, Biotechniques 6(7), 650-660; Shigekawa 
and Dower, 1989, Aust. J. Biotechnol. 3(1), 56-62). Une autre methode consiste a directement 
injecter les vecteurs dans ies cellules ou les tissus hotes par micro-injection (Gordon and Ruddle, 
1985, Gene 33(2), 121-136). De maniere avantageuse, la methode dite de "biolistique" pourra 
etre utilisee. EUe consiste a bombarder des cellules ou des tissus avec des particules sur 
lesquelles sont adsorbes les vecteurs de Tinvention (Bruce et al., 1989, Proc. Natl. Acad. Sci. 
USA 86(24), 9692-9696; Klein et al., 1992, Biotechnology 10(3), 286-291; US Patent No. 
4,945,050). De maniere preferentielle, la transformation de plantes se fera a Taide de bacteries du 
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genre Agrobacterium, de preference par infection des cellules ou tissus desdites piantes par A. 
tumefaciens (Knopf, 1979, Subcell. Biochem. 6, 143-173; Shaw et al., 1983, Gene 23(3):315- 
330) ou A. rhizogenes (Bevan et Chilton, 1982, Annu. Rev. Genet. 16:357-384; Tepfer and 
Casse-Delbart, 1987, Microbiol. Sci. 4(1), 24-28). De maniere preferentielle, la transformation 
de cellules vegetales par Agrobacterium tumefaciens est realisee selon le protocole decrit par 
Ishida et al. (1 996, Nat. Biotechnol. 14(6), 745-750). 

Ces differentes techniques sont notamment decrites dans les brevets et demandes de 
brevets suivants : US 4,459,355, US 4,536,475, US 5,464,763, US 5,177,010, US 5,187,073, EP 
267,159, EP 604 662, EP 672 752, US 4,945,050, US 5,036,006, US 5,100,792, US 5,371,014, 
US 5,478,744, US 5,179,022, US 5,565,346, US 5,484,956, US 5,508,468, US 5,538,877, US 
5,554,798, US 5,489,520, US 5,510,318, US 5,204,253, US 5,405,765, EP 270 615, EP 442 174, 
EP 486 233, EP 486 234, EP 539 563, EP 674 725, WO 91/02071 et WO 95/06128. 

La presente invention concerne egalement un procede de production des proteines Cry 
modifiees selon Tinvention. Ce procede comprend au moins les etapes de: 

(a) mise en culture d'un organisme hote transforme selon invention dans un milieu de 
culture adapte k la croissance et a la multiplication dudit organisme 

(b) extraction des proteines Cry produites par 1'organisme transforme cultive a l'£tape (a) 

Selon 1'organisme hote choisi pour mettre en oeuvre ce procede et selon le gene chimere 
qu'il contient, les proteines Cry produites sont soit produites dans l'organisme hote, soit secretees 
dans le milieu de culture. II s'ensuit que l'extraction prevue a l'etape (b) peut necessiter une etape 
de destruction des microorganismes, ou au moins des cellules les composant, afin de liberer les 
proteines Cry si celles-ci ne sont pas secretees dans le milieu de culture. L'etape d'extraction 
commune aux deux possibilites (proteines secretees ou non) consiste en une elimination des 
organismes hotes ou debris de ces organismes par filtration ou centrifugation du milieu de 
culture. 

Selon un mode de realisation particulier, ce procede de production des proteines Cry 
modifiees peut egalement comprendre une etape supplemental (c) de purification des proteines 
Cry produites a partir du milieu de culture. 
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Selon un mode de realisation prefere, I'organisme hote est un microorganisme. De maniere 
preferentielle, I'organisme hote est une bacterie Bacillus thuringiensis et la culture mise en oeuvre 
a 1'etape (a) est poursuivie jusqu'a la phase de sporulation desdites bacteries. 

La presente invention comprend egalement des plantes transformees avec un vecteur selon 
l'invention, caracterisees en ce qu'elles contiennent un gene chimere selon l'invention integre de 
maniere stable dans leur genome, et expriment une proteine Cry modifiee dans leurs tissus. 
L'invention s'etend egalement aux parties de ces plantes, et la descendance de ces plantes. On 
entend par "partie de ces plantes", tout organe de ces plantes, qu'il soit aerien ou souterrain. Les 
organes aeriens sont les tiges, les feuilles, les fleurs. Les organes souterrains sont principalement 
les racines, mais ils peuvent egalement etre des tubercules. Par "descendance", on entend 
principalement les graines contenant les embryons issus de la reproduction de ces plantes entre- 
elles. Par extension, le terme "descendance" s'applique a toutes les plantes et graines formees a 

« 

chaque nouvelle generation issues de croisement^ entre une plante, en particulier une variete 
vegetale, et une plante transformee selon ttnvention. 

Les plantes transformees selon l'invention peuvent etre des monocotyledones ou des 
dicotyl6dones. De preference, ces plantes sont des plantes d'interet agronomique. De maniere 
avantageuse, les plantes monocotyledones sont le ble, le mais, le riz. De maniere avantageuse, 

les plantes dicotyledones sont le colza, le soja, le tabac, le coton. 

. /. 

Selon un mode particulier de realisation de Tinvention, les plantes transformees selon 
l'invention contiennent, en plus d'un gene chimere selon Tinvention, au moins un autre gene 
contenant un polynucleotide codant pour une proline d'interet. Parmi les polynucleotides codant 
pour une proteine d'interet, on peut citer des polynucleotides codant une enzyme de resistance a 
un herbicide, par exemple le polynucleotide codant pour 1'enzyme bar (White et aL, NAR 
18:1062, 1990) pour la tolerance au bialaphos, le polynucleotide codant pour Tenzyme EPSPS 
(US 5,188,642; WO 97/04103) pour la tolerance au glyphosate ou encore le polynucleotide 
codant pour Tenzyme HPPD (WO 96/38567) pour la tolerance aux isoxazoles. Peuvent 
egalement etre contenus dans ces plantes des polynucleotides de resistance aux maladies, par 
exemple un polynucleotide codant pour 1'enzyme oxalate oxydase tel que decrit dans la demande 
de brevet EP 0 531 498 ou le brevet US 5,866,778, ou un polynucleotide codant pour un peptide 
antibacterien et/ou antifongique tels que ceux decrits dans les demandes de brevets 
WO 97/30082, WO 99/24594, WO 99/02717, WO 99/53053, et WO99/91089. On peut 
egalement citer des polynucleotides codant pour des caracteres agronomiques de la plante, en 
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particulier un polynucleotide codant pour une enzyme delta-6 desaturase tel que decrit dans les 
brevets US 5,552,306, US 5,614,3 1 3, et demandes de brevets WO 98/46763 et WO 98/46764, ou 
un polynucleotide codant pour une enzyme serine acetyltransferase (SAT) tel que decrit dans les 
demandes de brevets WO 00/01833 et PCT/FR 99/03179. Les plantes transformees selon 
l'invention peuvent egalernent contenir un polynucleotide codant pour une autre toxine 
insecticide, par exemple un polynucleotide codant pour une autre proteine Cry de Bacillus 
thuringiensis (pour exemple, voir la demande de brevet internationale WO 98/40490). 

La presente invention a egalernent pour objet des anticorps monoclonaux ou polyclonaux 
diriges contre une proteine Cry modifiee selon 1'invention, ou un fragment de celle-ci. Les 
techniques de production d'anticorps sont largement decrites dans la litterature generate et dans 
des ouvrages de reference tels que Immunological Techniques Made Easy (1998, O. Cochet, J.- 
L. Teillaud, C. Sautes eds, John Wiley & Sons, Chichester). De preference, les anticorps selon 
Tinvention sont mis en ceuvre dans des tests, ou kits, de detection des proteines Cry selon 
Tinvention. 

* 4 

Les exemples ci-apres permettent d'illustrer la presente invention, sans toutefois en 

» 

limiter la portee. 

Exemple 1 : Creation (Tun site de coupure par la pepsine au niveau de l'acide amine 164 de 

■ > - 

la toxine Cry9Cal 

L'introduction d'un site speciflque a la pepsine dans la toxine Cry9Cal de Bacillus 
thuringiensis est realisee par substitution de l'arginine naturellement presente en position 164 
chez cette toxine par Tun des trois acides amines reconnus par la pepsine : leucine, phenylalanine 
ou acide glutamique. L'acide amine 164 est present au niveau de la boucle inter-helices alpha 
reliant les helices alpha 3 et alpha 4 du domaine I (ci-apres boucle inter-helice alpha3-alpha4). 

La sequence native de la boucle inter-helice alpha3-alpha4 est comprise entre l'acide 
aspartique 159 et la valine 168. La sequence de cette boucle est la suivante : DRNDTRNLSV. 
Cettc sequence d'acides amines correspond a la sequence ADN suivante s'etendant de la base 475 
a la base 504 : 

GAT CGA AAT GAT ACA CGA AAT TTA AGT GTT 
Asp Arg Asn Asp Thr Arg Asn Leu Ser Val 
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Le codon 164 (CGA) codant pour I'arginine est modifie en codon codant soit pour la 
leucine, soit pour la phenylalanine ou soit pour Tacide glutamique. Les possibilites de codons 
sont les suivantes : 

Leucine : TTA, TTG, CTT, CTC, CTA ou CTG 

Phenylalanine : TTT ou TTC 

Acide Glutamique : GAA ou GAG 

Le choix des codons preferentiels lors de la mutagenese dirigee depend de Torganisme 
dans lequei le gene cry modifie doit etre exprime et varie done en consequence. Ce choix fait 
partie des connaissances generates de Thomme du metier qui adaptera les codons preferentiels en 
fonction de l'organisme de production choisi. Dans cet exemple, l'organisme d'expression choisi 
est la bacterie B. thuringiensis. Les codons preferentiellement utilises par B. thuringiensis pour 
coder la leucine, la phenylalanine ou l'acide glutamique sont, respectivement, TTA (leucine), 
TTT (phenylalanine) et GAA (acide glutamique). 

La modification pour expression chez chez Bt peut done etre realisee en utilisant les 
oligonucleotides de mutageneses suivants (dans les oligonucleotides decrits dans les exemples 
ci-apres, le codon en lettres majuscules correspond au codon mute, et les bases et acides amines 
en caracteres gras correspondent aux bases et acides amines specifiquement mutes): 

Oligonucleotide n° 1 : 5' - gat cga aat gat aca TTA aat tta agt gtt gtt - 3' 

Asp Arg Asn Asp Thr Leu Asn Leu Ser Val Val 

L'oligonucleotide n°l permet le remplacement de I'arginine 164 par une leucine 

Oligonucleotide n° 2 : 5 1 - gat cga aat gat aca TTT aat tta agt gtt gtt - 3' 

Asp Arg Asn Asp Thr Phe Asn Leu Ser Val Val 

L'oligonucleotide n°2 permet le remplacement de Targinine 164 par une phenylalanine 

Oligonucleotide n° 3 : 5' - gat cga aat gat aca GAA aat tta agt gtt gtt - 3' 

Asp Arg Asn Asp Thr Glu Asn Leu Ser Val Val 

L'oligonucleotide n°3 permet le remplacement de I'arginine 164 par un acide glutamique 

Les caracteristiques des souches bacteriennes de Escherichia coli utilisees pour la 
modification de la sequence du gene cry9Cal sont les suivantes : 
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- JM 109 de genotype recAl supE44 endAl hsdR17 gyrA96 relAl thiD (Iac-proAB) F' 
(traD36 proAB+ lacH lacZ DM15) 

- BMH 71-18 mut S de genotype thi, supE, A(lac-proAB), (mutS::TnIO)(F\ proAB, 
laciqZAM15). 

* 

L'ADN plasmidique est prepare par minipreparation selon la technique de la lyse alcaline 
(Birboim and Doly, 1979). Chaque colonie bacterienne est cultivee dans 2 ml de milieu LB 
additionne de l'antibiotique approprie pendant une nuit a 37 °C avec agitation (200 rpm). La 
culture est ensuite transferee dans un microtube puis centrifugee a 13500 g pendant 5 min. Apres 
elimination du surnageant, les bacteries sont resuspendues dans lOOjal d'une solution de 25mM 
Tris-HCI, pH 8, lOmM EDTA contenant de la Rnase A a la concentration finale de 100 fxg/ml. 
200 \xl d'une solution de NaOH 0,2M, 1% SDS sont rajoutes et la suspension est melangee deux 
fois par inversion du microtube. 150 |il d'une solution d'acetate de potassium 2,55 M, pH 4,5 
sont rajoutes et la suspension est incubee 5 min dans la glace. Apres une centrifugation de 15 
min a 13500 g, le surnageant est transfer^ dans un microtube contenant 1 ml d'ethanol froid. 
Apres une centriftigation de>30 min a 13500 g, le surnageant est elimine et le culot lave avec 1 
ml d'ethanol 70%. Le culot contenant l'ADN est seche quelques minutes sous vide puis repris 
dans 50 (xl d'eau distillee sterile. Les echantillons sont ensuite places a 65°C pendant 30 min. 

Les digestions par endonucleases de restriction sont realisees pour 1 \xg d'ADN dans un 
volume final de 20 |il en presence d'un dixieme de volume final de tampon 10X conseille par le 
fournisseur pour chaque enzyme et a Taide de 5 unites d'enzyme. La reaction est incubee pendant 
2 a 3 h a la temperature optimale pour Tenzyme. 

La dephosphorylation des extremites 5' engendrees par une enzyme de restriction est 
realisee avec la phosphatase alcaline d f intestin de veau. La reaction se fait en utilisant 5 |xl de 
tampon de dephosphorylation 10X (500 mM Tris-Hcl, pH 9,3, 10 mM MgCl 2 , ImM ZnCl 2 , 10 
mM spermidine) et une unite d'enzyme par jig d'ADN dans un volume final de 50 [x\. La reaction 
est incubee pendant une heurc a 37°C dans le cas d f extremites 5' sortantes ou a 55°C dans le cas 
d'extremites Tranches ou 3' sortantes. Apres la dephosphorylation, l'enzyme est ensuite inactivee 
pendant 30 min a 65°C puis eliminec avec deux extractions volume a volume avec un melange 
de phenol-chloroforme-alcool isoamylique (25-24-1). Les ligatures se font a Taide de l'ADN 
ligase du phage T4. Ellcs sont realisees avec une quantite de vecteur egale a 100 ng et un rapport 
molaire insert/vecteur compris cntre 5 et 10. Le volume final de la reaction est de 30 yi\ et 
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comprend 3 jil de tampon de ligature 10X (300 mM Tris-Hcl, pH 7,8, 100 mM MgC12, 100 mM 
DTT, 10 mM AJP) et 3 unites d'enzyme. La reaction est incubee une nuit a 14°C. 

Les oligonucleotides de mutagenese (oligonucleotide n°l, oligonucleotide n°2 et 
oligonucleotide n°3) sont phosphoryles en 5' afin de permettre la ligature. 100 pmoles 
^oligonucleotide sont incubes 30 min a 37°C avec 5 unites de T4 polynucleotide kinase dans un 
volume final de 25 |il en presence de 2,5 |nl de tampon 10X de phosphorylation (700 mM Tris- 
Hcl, pH 7,6, 100 mM MgC12, 50 mM DTT) en presence d'ATP a la concentration finale de 
ImM. L'enzyme est ensuite inactivee a 70°C pendant 10 min. 

La mutagenese dirigee est conduite selon une methode classique decrite ci-apres. D'autres 
procedures connues des experts de Tart sont decrites dans la litterature et donnent des resultats 
identiques. La methode de mutagenese dirigee utilisee est celle decrite par le fabricant pour l'usage 
du systeme Altered Sites II commercialise par la societe Promega. Une description detaillee du 
systeme de mutagenese et du protocole peut etre trouvee sur le site internet de la societe Promega a 
l'adresse http://www.promega.com. Le gene cry9Cal est prealablement clone dans un phagemide 
pAlter-1 (Promega) portant le gene de resistance a la tetracycline et le gene de resistance a 
l'ampicilline contenant une mutation ponctuelle. Le fragment d'ADN a muter est au prealable clone 
dans le plasmide pAlter-1. 0.5 pmol d'ADN plasmidique sont denatures en rajoutant 2 y\ de NaOH 

2M, 2 mM EDTA dans un volume final de 20 (il et en incubant 5 min a temperature ambiante. 2 |il 

» 

d'acetate d'ammonium 2M, pH 4,6 et 75 ^1 d'ethanql sont rajoutes et le melange est incube a -70°C 
pendant 30 min. Apres une centrifugation a 14000 g pendant 15 min a 4°C, le culot est ensuite rince 
avec 200 \A d'ethanol 70% et recentrifuge a 14000 g pendant 15 min a 4°C. Le culot d'ADN 
denature est alors seche sous vide et resuspendu dans 100 \i\ d'eau distillee sterile. 10 \x\ d'ADN 
denature c'est-a-dire 0,05 pmol sont melanges avec 0.25 pmol d'oligonucleotide de reparation du 
gene de resistance a Tampicilline phosphoryle, 0.25 pmol d*oligonucleotide de destruction du gene 
de resistance a la tetracycline et 1.25 pmol d'oligonucleotide de mutagenese (oligonucleotide n°l, 
n°2 ou n°3) phosphoryle en presence de tampon d'hybridation (20 mM Tris-HCl, pH 7,5, 10 mM 
MgC12, 50 mM NaCl) et incubes a 75°C pendant 5 min puis refroidis lentement jusqu'a temperature 
ambiante. 5 |il d'eau distillee sterile, 3 |il de tampon de synthese 1 Ox (100 mM Tris-HCl, pH7 ? 5, 20 
mM DTT, 10 mM ATP, 5mM dNTP), 10 unites d'ADN polymerase T4 et 3 unites d'ADN ligase T4 
sont rajoutes et la reaction est incubee 90 min a 37°C. 200 ^1 de bacteries competentes E. coli BMH 
71-18 sont alors incubees en presence de 1,5 ^1 de la reaction precedente dans de la glace pendant 
30 min. Un choc thermique est ensuite effectue en pla^ant les bacteries 50 sec a 42°C puis 2 min 
dans la glace. 900 ^1 de milieu LB sont ensuite rajoutes et la suspension est incubee a 37°C pendant 
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une heure sous agitation. 4 ml de milieu LB additionne d'ampicilline a la concentration finale de 
100 ug/ml sont alors rajoutes et la culture est incubee une nuit a 37°C sous agitation. Une 
minipreparation d'ADN plasmidique est realisee a parti r des 4 ml de culture selon le protocole 
d'extraction d'ADN plasmidique decrit precedemment. 200 ul de bacteries competentes E. coli 
JM109 sont alors incubees en presence de 1 ng d'ADN plasmidique dans de la glace pendant 30 
min. Un choc thermique est ensuite effectue en placant les bacteries 50 sec. a 42°C puis 2 min. dans 
la glace. 900 ul de milieu LB sont ensuite rajoutes et la suspension est incubee a 37°C pendant une 
heure sous agitation. 100 ul de suspension bacterienne sont ensuite etales sur une boite de Petri 
contenant du milieu LB solide additionne d'ampicilline a la concentration finale de 100 ug/ml. Les 
recombinants obtenus sont cribles pour trouver le clone d'interet. Cette recherche est effectuee en 
isolant l'ADN plasmidique de plusieurs colonies par la technique de minipreparation decrite 
precedemment puis par sequencage de cet ADN. La selection des recombinants se fait alors a 1'aide 
de milieu additionne de tetracycline a la concentration finale de 12,5 ug/ml. La justesse de la 
mutation souhaitee et la verification de l'absence de mutations indesirables sont controlees par 
sequencage de l'ADN apres mutagenese dirigee. Des echantillons d'ADN pour le sequencage sont 
purifies avec le Wizard Plus SV Minipreps DNA Purification System (Promega) selon la procedure 
recommandee par le fournisseur et le sequencage est realise sur un sequenceur automatique ABI 
377 (Perkin-Elmer) a partir de reactions de sequencage conduite selon la methode de terminaison de 
chaine (Sanger et al, 1977), par PCR en utilisant le systeme ABI PRISM BigDye terminator Cycle 
Sequencing Kit. Pour la realisation des reactions de sequencage et l'analyse automatique des 
echantillons, les procedures utilisees sont celles recommandees par le fournisseur (Applied 
Biosystems). 

Exemple 2 : Creation de sites de coupure par la pepsine au niveau de la boucle inter-helice 

alpha 3-alpha 4 de la toxine Cry9Cal 

L' introduction de sites specifiques a la pepsine dans la boucle inter-helice alpha3-alpha4 
de la toxine Cry9Cal est realisee par substitution d'au moins un acide amine de cette boucle 
inter-helice par un acide amine reconnu par la pepsine, a savoir la leucine, la phenylalanine et 
l'acide glutamique. Des codons codant pour ces trois acides amines seront done crees en place 
des codons naturellement presents dans la region s'etendant de la base 475 a la base 504. Les 
possibilites de codons pour ces trois acides amines sont decrites dans l'Exemple 1 . 

Comme dans l'Exemple 1, l'organisme de production de la proteine Cry modifiee choisi 
est la bacicrie B. thuringiensis, ct le choix des codons de remplacement est done identique a celui 
de l'Exemple 1. En outre, si un autre organisme de production est choisi, l'homme du metier 
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saura adapter les codons prefcrentiels en fonction de Torganisme de production choisi. 

Diverses sequences alternatives pour la boucle inter-helice alpha 3-alpha 4 sont possibles, 
chacune possedant un nombre variable de residus leucine, phenylalanine ou acide glutamique. 
Certaines de ces possibilites sont presentees dans le tableau 1 . Les possibilites de modification de 
la boucle inter-helice alpha 3-alpha 4 ne sont pas limitees a celles presentees dans le tableau 1 ci- 
dessous. La liste presentee dans le tableau 1 a pour objectif d'illustrer certaines des possibilites 
de modification sans limiter la portee de Tinvention a ces illustrations. L'homme du metier 
connaissant les codons specifiques de chaque acide amines selon les organismes saura adapter 
Tenseignement decrit dans cet exemple a toutes les possibilites de modifications de la boucle 
inter-helice alpha3-alpha4, en particulier a celles qui ne sont pas decrites dans le tableau 1. 

Tableau 1. Exemples de modifications possibles de la boucle inter-helice alpha 3-alpha 4 de la 
toxine Cry9Cal 

Proteine Sequence en Sequence nucleotidique 

acides amines 



Cry9Cal 




DRNDTRNLSV 


gat 


cga 


aat 


gat 


aca 


cga 


aat 


tta 


agt 


gtt 








Asp 


Arg 


Asn 


Asp 


Thr 


Arg 


Asn 


Leu 


Ser 


Val 


Mutant n° 


1 


ELNEFLNLSV 


gaA 


TTa 


aat 


gaA 


TTT 


TTa 


aat 


tta 


agt 


gtt 








Glu 


Leu 


Asn 


Glu 


Phe 


Leu 


Asn 


Leu 


Ser 


Val 


Mutant n° 


2 


ELNELLNLSV 


gaA 


TTa 


aat 


gaA 


TTa 


TTa 


aat 


tta 


agt 


gtt 








Glu 


Leu 


Asn 


Glu 


Leu 


Leu 


Asn 


Leu 


Ser 


Val 


Mutant n° 




ELLEFLLLSV 


gaA 


TTa 


TTA 


gaA 


TTT 


TTa 


TTA 


tta 


agt 


gtt 








Glu 


Leu 


Leu 


Glu 


Phe 


Leu 


Leu 


Leu 


Ser 


Val 


Mutant n° 


4 


ELLELLLLSV 


gaA 


TTa 


TTA 


gaA 


TTa 


TTa 


TTA 


tta 


agt 


gtt 








Glu 


Leu 


Leu 


Glu 


Leu 


Leu 


Leu 


Leu 


Ser 


Val 


Mutant n° 


5 


ELLEELLLSV 


gaA 


TTa 


TTA 


gaA 


GAa 


TTa 


TTA 


tta 


agt 


gtt 








Glu 


Leu 


Leu 


Glu 


Glu 


Leu 


Leu 


Leu 


Ser 


Val 


Mutant n° 


6 


ERLEFLLLSV 


gaA 


cga 


TTA 


gaA 


TTT 


TTa 


TTA 


tta 


agt 


gtt 








Glu 


Arg 


Leu 


Glu 


Phe 


Leu 


Leu 


Leu 


Ser 


Val 


Mutant n° 


7 


ERLELLLLSV 


gaA 


cga 


TTA 


gaA 


TTa 


TTa 


TTA 


tta 


agt 


gtt 








Glu 


Arg 


Leu 


Glu 


Leu 


Leu 


Leu 


Leu 


Ser 


Val 


Mutant n° 


8 


ERLEELLLSV 


gaA 


TTa 


GAA 


gaA 


TTa 


TTa 


TTA 


tta 


agt 


gtt 








Glu 


Leu 


Glu 


Glu 


Leu 


Leu 


Leu 


Leu 


Ser 


Val 


Mutant n° 


9 


ELLKEKELSV 


gaA 


TTa 


TTA 


gaA 


GAa 


GAa 


GAA 


tza 


agt 


gtt 








Glu 


Leu 


Leu 


Glu 


Glu 


Glu 


Glu 


Leu 


Ser 


Val 
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La substitution de plusieurs acides amines au sein de la boucle inter-helice alpha3-alpha 4 
necessite pour chacun des mutants 1'utiiisation successive de plusieurs oligonucleotides de 
mutagenese. Les oligonucleotides de mutagenese necessaires a la creation des exemples de 
mutants presentes dans le tableau 1 sont presentes ci-apres (numerotes de 4 a 20). 



Oligonucleotide n° 4 : 



Oligonucleotide n°: 5 : 



Oligonucleotide n° 6 : 



Oligonucleotide n° 7 : 



Oligonucleotide n° 8 : 



Oligonucleotide n° 9 : 



Oligonucleotide n° 10 : 



Oligonucleotide n° 1 1 : 



Oligonucleotide n°12 : 



Oligonucleotide n° 13 : 



Oligonucleotide n° 14 : 



Oligonucleotide n° 15 : 



Oligonucleotide n° 16 : 



Oligonucleotide n° 17 : 



Oligonucleotide n° 18 : 



Oligonucleotide n° 19 



Oligonucleotide n° 20 



cga aat 

Arg Asn 

cga aat 

Arg Asn 

ttg get 

Leu Ala 
ttg get 

Leu Ala 

ttg get 

Leu Ala 

ttg get 

Leu Ala 

ttg get 

Leu Ala 

ttg get 

Leu Ala 

caa aat 

Gin Asn 

'caa aat 

Gin Asn 

caa aat 

Gin Asn 

caa aat 

Gin Asn 

caa aat 

Gin Asn 

caa aat 

G i : : A s n 

caa aat 

Gin Asn 



.tu aat 



C a :3 ^ct 

Gin Asn 



gat aca cga 

Asp Thr Arg 

gat aca cga 

Asp Thr Arg 

gat cga aat 

Asp Arg Asn 
gat cga aat 

Asp Arg Asn 

gat cga aat 

Asp Arg Asn 

gat cga aat 

Asp Arg Asn 

gat cga aat 

Asp Arg Asn 

gat cga aat 

Asp Arg Asn 

tgg ttg get 

Trp Leu Ala 

tgg ttg get 

Trp Leu Ala 

tgg ttg get 

Trp Leu Ala 

tgg ttg get 

Trp Leu Ala 

tgg ttg get 

Trp Leu Ala 

tgg ttg get 

Trp Leu Ala 

tgg ttg get 

Trp Leu Ala 

tgg ttg get 

Trp Leu Ala 

egg ttg get 

Trp Leu Ala 



TTA tta agt 
Leu . Leu Ser 
GAA tta agt 
Glu Leu Ser 
gaA TTT TTa 

Glu Phe Leu 

gaA TTT TTa 

Glu Phe 
gaA TTa 
Glu Leu 
gaA TTa 
Glu Leu 
gaA GAa 
Glu Glu 
gaA GAa 
Glu Glu 
gaA TTa 
Glu Leu 
gaA TTa 
Glu Leu 
gaA TTa 
Glu Leu 
gaA TTa 
Glu Leu 
gaA TTa 
Glu Leu 
gaA cga 
Glu Arg 
gaA cga 
Glu Arg 
gaA TTa 
Glu Leu 
gaA TTa 
Glu Leu 



gtt 

Vja-1 

gtt 

Val 

aat 

Asn 
tta 



gtt 

Val 

gtt 

Val 

tta 

Leu 
tta 



Leu Leu Leu 



cgt 

Arg 

cgt 

Arg 

agt 

Ser 
agt 

Ser 



TTa aat tta agt 
Leu Asn Leu Ser 
TTa tta tta agt 
Leu Leu Leu Ser 
GAa gaa tta agt 
Glu Glu Leu Ser 
TTa tta tta agt 
Leu Leu Leu Ser 
aat gaa tta tta 
Asn Glu Leu Leu 
aat gaa ttt tta 
Asn Glu Phe Leu 
TTA gaa ttt tta 
Leu Glu Phe Leu 
TTA gaa tta tta 
Leu Glu Leu Leu 
TTA gaa gaa tta 
Leu Glu Glu Leu 
TTA gaa ttt tta 
Leu Glu Phe Leu 
TTA gaa tta tta 
Leu Glu Leu Leu 
gaA gaa tta tta 
Glu Glu Leu Leu 
TTA gaa gaa gaa 
Leu Glu Glu Glu 



gtt gtt 

Val Val 
gtt gtt 

Val Val 

gtt gtt 

Val Val 

gtt gtt 

Val Val 

gtt gtt 

Val Val 

gtt gtt 

Val Val 

aat 

Asn 

aat 

Asn 

tta tta 
Leu Leu 
tta tta 
Leu Leu 
tta tta 
Leu Leu 
tta tta 
Leu Leu 
tta tta 
Leu Leu 
tta tta 
Leu leu 
gaa tta 
Glu Leu 
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La procedure de mutageneses dirigees successives est similaire a la procedure decrite 
dans l'exemple 1. La seule difference reside dans la combinaison des oligonucleotides. Pour 
chacun des exemples de mutants decrits dans le tableau 1, les combinaisons successives 
d'oligonucleotides sont decrites ci-apres. 

Mutant n° 1 : La creation du mutant n°l necessite deux series successives de 
mutageneses dirigees selon le protocole decrit dans l'exemple 1 en utilisant ('oligonucleotide n°6 
lors de la premiere mutagenese et Toligonucleotide n° 13 lors de la seconde. L'oligonucleotide n° 

1 3 est defini pour reconnaitre les modifications apportees lors de la premiere mutagenese avec 
l'oligonucleotide n°6. 

Mutant n° 2 : La creation du mutant n° 2 necessite deux series successives de 
mutageneses dirigees selon le protocole decrit dans l'exemple 1 en utilisant l'oligonucleotide n°8 
lors de la premiere mutagenese et l'oligonucleotide n° 12 lors de la seconde. L'oligonucleotide n° 
12 est defini pour reconnaitre les modifications apportees lors de la premiere mutagenese avec 
l'oligonucleotide n°8. 

Mutant n° 3 : La creation du mutant n° 3 necessite trois series successives de 
mutageneses dirigees selon le protocole decrit dans Pexemple 1 en utilisant l'oligonucleotide n°4 
lors de la premiere mutagenese, l'oligonucleotide n° 7 lors de la deuxieme et l'oligonucleotide n° 

14 lors de la troisieme. L'oligonucleotide n° 7 est defini pour reconnaitre les modifications 
apportees lors de la premiere mutagenese avec l'oligonucleotide n°4 et l'oligonucleotide n° 14 est 
defini pour reconnaitre les modifications apportees lors des deux premieres mutageneses avec les 
oligonucleotides n° 4 et n° 7. 

Mutant n° 4 : La creation du mutant n° 4 necessite trois series successives de 
mutageneses dirigees selon le protocole decrit dans l'exemple 1 en utilisant l'oligonucleotide n°4 
lors de la premiere mutagenese, l'oligonucleotide n° 9 lors de la deuxieme et l'oligonucleotide n° 

15 lors de la troisieme. L'oligonucleotide n° 9 est defini pour reconnaitre les modifications 
apportees lors de la premiere mutagenese avec l'oligonucleotide n°4 et l'oligonucleotide n° 1 5 est 
defini pour reconnaitre les modifications apportees lors des deux premieres mutageneses avec les 
oligonucleotides n° 4 et n° 9. 

Mutant n° 5 : La creation du mutant n° 5 necessite trois series successives de 
mutageneses dirigees selon le protocole decrit dans l'exemple 1 en utilisant l'oligonucleotide n°4 
lors de la premiere mutagenese, l'oligonucleotide n° 1 1 lors de la deuxieme et l'oligonucleotide 
n° 16 lors de la troisieme. L'oligonucleotide n° 11 est defini pour reconnaitre les modifications 
apportees lors de la premiere mutagenese avec l'oligonucleotide n°4 et l'oligonucleotide n° 16 est 
defini pour reconnaitre les modifications apportees lors des deux premieres mutageneses avec les 
oligonucleotides n° 4 ct n° 1 1. 
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Mutant n° 6 : La creation du mutant n° 6 necessite trois series successives de 
mutageneses dirigees selon le protocole decrit dans l'exemple 1 en utilisant l'oligonucieotide n°4 
lors de la premiere mutagenese, I'oligonucleotide n° 7 lors de la deuxieme et l'oligonucieotide n° 

17 lors de la troisieme. L'oligonucieotide n° 7 est defini pour reconnaitre les modifications 
apportees lors de la premiere mutagenese avec I'oligonucleotide n°4 et ^'oligonucleotide n° 17 est 
defini pour reconnaitre les modifications apportees lors des deux premieres mutageneses avec les 
oligonucleotides n° 4 et n° 7. 

Mutant n° 7: La creation du mutant n° 7 necessite trois series successives de 
mutageneses dirigees selon le protocole decrit dans l'exemple 1 en utilisant I'oligonucleotide n°4 
lors de la premiere mutagenese, l'oligonucieotide n° 9 lors de la deuxieme et I'oligonucleotide n° 

18 lors de la troisieme. L'oligonucieotide n° 9 est defini pour reconnaitre les modifications 
apportees lors de la premiere? mutagenese avec I'oligonucleotide n°4 et I'oligonucleotide n° 18 est 
defini pour reconnaitre les modifications apportees lors des deux premieres mutageneses avec les 
oligonucleotides n° 4 et n° 9. 

* 

Mutant n° 8: La creation du mutant n° 8 necessite trois series successives de 

» 

mutageneses dirigees selon le protocole decrit dans l'exemple 1 en utilisant I'oligonucleotide n°4 
lors de la premiere mutagenese, I'oligonucleotide n° 9 lors de la deuxieme et I'oligonucleotide n° 

19 lors de la troisieme. L'oligonucieotide n° 9 est defini pour reconnaitre les modifications 
apportees lors de la premiere mutagenese avec I'oligonucleotide n°4 et I'oligonucleotide n° 1 9 est 

defini pour reconnaitre les modifications apportees lors des deux premieres mutageneses avec les 

i 

oligonucleotides n° 4 et n° 9. 

Mutant n° 9 : La creation du mutant n° 9 necessite trois series successives de 
mutageneses dirigees selon le protocole decrit dans l'exemple 1 en utilisant I'oligonucleotide n°5 
lors de la premiere mutagenese, I'oligonucleotide n° 10 lors de la deuxieme et I'oligonucleotide 
n° 20 lors de la troisieme. L'oligonucieotide n° 10 est defini pour reconnaitre les modifications 
apportees lors de la premiere mutagenese avec I'oligonucleotide n°5 et I'oligonucleotide n° 20 est 
defini pour reconnaitre les modifications apportees lors des deux premieres mutageneses avec les 
oligonucleotides n° 5 et n° 10. 

Selon ce protocole, les oligonucleotides sont repartis en trois categories, oligonucleotides 
de I serie, oligonucleotides dc 2 cmc serie et oligonucleotides de 3 serie. Cette repartition est 
la suivante : 

Oligonucleotides de l i,e serie : Oligonucleotides n° 4, 5, 6 et 8 
Oligonucleotides de 2 4me serie : Oligonucleotides n° 7, 9, 10, 1 1, 12 et 13 
Oligonucleotides de 3* mc serie : Oligonucleotides n° 14, 15, 16, 17, 18, 19 et 20 
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Le protocole complet de realisation de ces mutants est identique a celui decrit dans 
I'Exemple 1. Ce protocole est commun a chacune des series de mutageneses, seuls Toligonucleotide 
de mutagenese et l'oligonucleotide d'inibition/restauration de la resistance a l'antibiotique changent. 
Le passage a la mutation suivante s'effectue apres le criblage du clone d'interet ayant integre la 
mutation prccedente. Si cette etape est la derniere de la premiere serie ou de la deuxieme serie de 
mutagenese, le materiel issu des cette serie d'experimentations est reutilise comme materiel initial 
pour respect ivement la deuxieme ou la troisieme serie de mutagenese en utilisant respectivement Ies 
oligonucleotides de 2 eme ou de 3 cme serie. Un deuxieme cycle de mutagenese peut alors etre effectue 
en utilisant 1'ADN plasmidique obtenu comme ADN matrice ainsi que ['oligonucleotide de 
reparation du gene de resistance a la tetracycline et l'oligonucleotide de destruction du gene de 
resistance a Tampicilline et un oligonucleotide de mutagenese de 2eme serie. La selection des 
recombinants se fait alors a Paide de milieu additionne de tetracycline a la concentration finale de 
12,5 ^g/mL Un troisieme cycle de mutagenese peut etre realise en utilisant FADN plasmidique 

obtenu a Tissue du deuxieme cyle de mutagenese comme ADN matrice ainsi que l'oligonucleotide 

■» 

de reparation du gene de resistance a Pampicilline et l'oligonucleotide de destruction du gene de 
resistance a la tetracycline et un oligonucleotide he mutagenese de 3eme serie. La selection des 

* 

recombinants se fait alors a 1'aide de milieu additionne d'ampicilline a la concentration finale de 
100 ng/ml. Apres realisation de toutes les series de mutagenese necessaires a la realisation d r un 
mutant, les etapes de controles des mutations sont r^alisees comme decrites a l'Exemple 1 . 

5 

Exemple 3 : Creation de sites de coupure par la pepsine dans les boucles inter-helices alpha 
4-alpha 5, alpha 5-alpha 6 et alpha 6-alpha 7 de la toxine Cry9Cal 

Les positions des sequences natives des boucles inter-helices alpha 4-alpha 5, 
alpha 5-alpha 6 et alpha 6-alpha 7 de la toxine Cry9Cal sont presentees dans le tableau 2 ci- 
apres. Les sequences nucleotidiques et les positions correspondantes dans le gene cry9Cal sont 
presentees dans le tableau 3. 



Tableau 2. Position et sequences des boucles inter-helices a4-a5, a5-a6 et a6-a7 de la 
toxine Cry9Cal 

Sequence Position 

FAVNGQQVPLL Phenylalanine 187 a Leucine 197 

LFGHGWGF Leucine 216 a Phenylalanine 223 

LRGTN Leucine 257 a Asparagine 261 



Boucie 

Boucle a.4-a5 
Boucie a5-a6 
Boucle a6-a7 
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Tableau 3. Position et sequences du gene cry9Cal codant les boucles inter-helices ct4-a5, 
a5-a6 et a6-a7 

Boucle Sequence Position 

Boucle a4-a5 TTT GCA GTA A AT GGA CAG CAG GTT CCA TTA CTG 559 - 591 

Boucle a5- a6 CTT TTT GGA GA A GGA TGG GGA TTC 646 - 669 

Boucle a6- a 7 TTA AGA GGA ACA AAT 769- 783 

La superposition des sequences nucleotidiques et acides amines est la suivante : 

Boucle a4— a5 : TTT GCA GTA AAT GGA CAG CAG GTT CCA TTA CTG 

Phe Ala Val Asn Gly Gin Gin Val Pro Leu leu 

Boucle Ct5-a6 CTT TTT GGA GAA GGA TGG GGA TTC 

Leu Phe Gly Glu Gly Trp Gly Phe 

Boucle a6- al TTA AGA GGA ACA AAT 

4 

Leu Arg- Gly thr Asn 

• v 

L'introduction de sites *specifiques a la pepsine dans les boucles inter-helices alpha4- 
alpha5, alpha5-alpha6 ou alph&6-alpha7 de la toxine Cry9Cal est realisee par substitution d'au 
moins un acide amin6 de ces hjoucles inter-helices par un acide amin6 reconnu par la pepsine, a 
savoir la leucine, la phenylalanine et 1'acide glutamique. Des codons codant pour ces trois acides 
amines seront done crees en pjace des codons naturellement presents dans la region s'etendant 
des bases 559 a 591 (boucle iiiter-helice alpha4-alpha5), 646 a 669 (boucle inter-helice alpha5- 
alpha6), et 769 a 783 (boucle) inter-helice alpha6-alpha7). Les possibilites de codons pour ces 
trois acides amines sont decritds dans TExemple 1 . 

Comme dans l'Exemple 1, 1'organisme de production de la proteine Cry modifiee choisi 
est la bacterie B. thuringiensis, et le choix des codons de remplacement est done identique a celui 
de TExemple 1. En outre, si un autre organisme de production est choisi, I'homme du metier 
saura adapter les codons preferentiels en fonction de Torganisme de production choisi. 

Diverses sequences alternatives pour ies boucles inter-helice alpha4-alpha5, alpha5- 
alpha6 et alpha6-alpha7 sont possibles, chacune possedant un nombre variable de residus 
leucine, phenylalanine ou acide glutamique. Plusieurs de ces diverses possibilites sont presentees 
dans les tableaux 4, 5 et 6. Les possibilites de modification des boucles inter-helice alpha4- 
alpha5, alpha5-alpha6 et alpha6-alpha7 ne sont pas limitees a celles presentees dans les tableaux 
4, 5 et 6 ci-dessous. La listc presentee dans les tableaux 4, 5 et 6 a pour objectif d'illustrer 
certaines des possibilites de modification sans limiter la portee de I'invcntion a ces illustrations. 
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L'homme du metier connaissant les codons specifiques de chaque acide amine selon les 
organismes saura adapter l'enseignement decrit dans cet exemple a toutes les possibilites de 
modifications des boucles inter-helices alpha4-alpha5, alpha5-alpha6 et alpha6-alpha7, en 
particulier a celles qui ne sont pas decrites dans les tableaux 4, 5 et 6. 

Tableau 4. Exemples de modifications possibles de la boucle inter-helice alpha 4-alpha 5 de 
la toxine Cry9Cal 

Proteine Sequence en Sequence nucleotidique 

acides amines 



Cry9Cal 




FAVNGQQVPLL 


ttt 


gca 


gta 


aat 


gga 


cag 


cag 


gtt 


cca 


tta 


ctg 








Phe 


Ala 


Val 


Asn 


Gly 


Gin 


Gin 


Val 


Pro 


Leu 


leu 


Mutant n° 


10 


FLLNLFFLPLL 


ttt 


TTa 


Tta 


aat 


TTa 


TTT 


TTT 


TtA 


cca 


tta 


ctg 








Phe 


Leu 


leu 


Asn 


Leu 


Phe 


Phe 


Leu 


Pro 


Leu 


leu 


Mutant n° 


11 


FLLNLEELPLL 


ttt 


TTa 


Tta 


aat 


TTa 


GaA 


GaA 


TtA 


cca 


tta 


ctg 








Phe 


Leu 


leu 


Asn 


Leu 


Glu 


Glu 


Leu 


Pro 


Leu 


leu 


Mutant n° 


12 


FEENLEELPLL 


ttt 


GAa 


GAa 


aat 


TTa 


GaA 


GaA 


TtA 


cca 


tta 


ctg 








Phe 


Glu 


Glu 


Asn 


Leu 


Glu 


Glu 


Leu 


Pro 


Leu 


leu 


Mutant n° 


13 


FEENFLLFPLL 


ttt 


GAa 


GAa 


aat 


TTT 


TTA 


TTA 


Ttt 


cca 


tta 


ctg 








Phe 


Glu 


Glu 


Asn 


Phe 


leu 


Leu 


Phe 


Pro 


Leu 


leu 


Mutant n° 


14 


FEENFEEFPLL 


ttt 


GAa 


GAa 


aat 


TTT 


GaA 


GaA 


Ttt 


cca 


tta 


ctg 








Phe 


Glu 


Glu 


Asn 


Phe 


Glu 


Glu 


Phe 


Pro 


Leu 


leu 


Mutant n° 


15 


FLLNFEEFPLL 


ttt 


TTa 


TTa 


aat 


TTT 


GaA 


GaA 


Ttt 


cca 


tta 


ctg 








Phe 


Leu 


leu 


Asn 


Phe 


Glu 


Glu 


Phe 


Pro 


Leu 


leu 


Mutant n° 


16 


FLLNEFFEPLL 


ttt 


TTa 


TTa 


aat 


GAa 


TTT 


TTT 


gAA 


cca 


tta 


ctg 








Phe 


Leu 


leu 


Asn 


Glu 


Phe 


Phe 


Glu 


Pro 


Leu 


leu 



Tableau 5. Exemples de modifications possibles de la boucle inter-helice alpha 5-alpha 6 de 
la toxine Cry9Cal 

Proteine Sequence en Sequence nucleotidique 

acides amines 



Cry9Cal 




LFGEGWGF 


ctt 


ttt 


gga 


gaa 


gga 


tgg 


gga 


ttc 








Leu 


Phe 


Gly 


Glu 


Gly 


Trp 


Gly 


Phe 


Mutant n° 


17 


LFLELFLF 


ctt 


ttt 


TTa 


gaa 


TTa 


tTT 


TTa 


ttc 








Leu 


Phe 


Leu 


G 1 u 


Leu 


Phe 


Leu 


Phe 


Mutant n° 


18 


LFLLLFLF 


ct t 


ttt 


TTa 


TTa 


TTa 


tTT 


TTa 


ttc 








Leu 


Phe 


Leu 


Leu 


Leu 


Phe 


Leu 


Phe 


Mutant n° 


19 


LFLEEFEL 




ttt 


TTa 


gaa 


gAa 


tTT 


gAa 


TTA 








Leu 


Phe 


Leu 


Glu 


Glu 


Phe 


Glu 


Leu 


Mutant n° 


20 


LFEEEFEL 


ctt 


ttt 


gAa 


gaa 


gAa 


tTT 


gAa 


TTA 








Leu 


Phe 


Glu 


oiU 


Glu 


Phe 


Glu 


Leu 
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Mutant n° 21 LFEEEFEE ctt ttt gAa gaa TTa ITT gAa GAA 

Leu Phe Glu Glu Glu Phe Glu Glu 

Tableau 6. Exemples de modifications possibles de la boucle inter-helice alpha 6-alpha 7 de 
la toxine Cry9Cal 

Proteine Sequence en Sequence nuucleotidique 

acides amines 



Cry9Cal 



LRGTN 



Mutant n° 22 LLELN 



Mutant n° 23 LLFLN 



Mutant n° 24 LELLN 



Mutant n° 25 LLFFN 



Mutant n° 26 LEELN 



Mutant n° 27 LEFLN 



Mutant n° 28 LEFEN 



Mutant n° 29 LEEEN 



A. t~ ~ 

tta 


aga 




aca 


aat 


Lieu 


TV -v* 

/\rg 


b x y 


t- K v 

tnr 


ms n 


t ta 


TTa 


gAa 


1 ra 


aa t 




J_i©U 


l?xU 


L8U 


7\ 0 


4- 4- 

tta 


TTa 


TTT 


TTa 


aat 


Leu 


LOU 




LQU 




+- +- -i 
tta 




x xa 


11a 


aat 


Leu 


Glu 


Leu 


Leu 


Asn 


tta 


TTa 


TTT 


TTT 


aat 


Leu 


Leu 


Phe 


Phe 


Asn 


tta 


GAa 


GAa 


TTa 


aat 


Leu 


Glu 


Glu 


Leu 


Asn 


tta 


GAa 


TTT 


TTa 


aat 


Leu 


Glu 


Phe 


Leu 


Asn 


tta 


GAa 


TTT 


GAa 


aat 


Leu 


Glu 


Phe 


Glu 


Asn 


tta 


GAa 


gAa 


GAa 


aat 


Leu 


Glu 


Glu 


Glu 


Asn 



3-1- Creation de sites de coupure par la pepsine dans la boucle inter-helice alpha4- 
alpha S 

La substitution de plusieurs acides amines au sein de la boucle inter-helice a!pha4-alpha 5 
necessite pour chacun des mutants l'utilisation successive de plusieurs oligonucleotides de 
mutagenese. Les oligonucleotides de mutagenese necessaires a la creation des exemples de 
mutants presentes dans le tableau 4 sont presentes ci-apres (numerotes de 21 a 34). 



Oligonucleotide n° 21 : 
Oligonucleotide n° 22 : 
Oligonucleotide n° 23 : 



get at: cca ttg 

Ala Tie Pro :,eu 

get art :ca ttg 

Ala lie Pro Leu 

tta tta aat gga 

Leu leu Asn Gly 



ttt TTa Tta aat 

Phe Leu leu As T. 

ttt GAa GAa ?.at 

Phe Glu Glu Asn 

cag cag TtA cca 

Gin Gin Leu Pro 



gga cag cag gtt 
Gly Gin Gin Val 
gga cag cag gz t 
Gly Gin Gin Val 
tta ctg tea gta 
Leu Leu Ser Val 
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Oligonucleotide n° 


24 : 


tta 


tta 


aat 


gga 


cag 


cag 


Ttt 


cca 


tta 


ctg 


tea 


gta 












Leu 


leu 


Asn 


Gly 


Gxn 


Gin 


Phe 


Pro 


Leu 


Leu 


Ser 


Val 








Oligonucleotide n° 


25 : 


tta 


tta 


aat 


gga 


cag 


cag 


gAA 


cca 


tta 


ctg 


tea 


gta 












Leu 


leu 


Asn 


Gly 


Gin 


Gin 


Glu 


Pro 


Leu 


Leu 


Ser 


Val 








z*\ • * 1**1 s> 

Oligonucleotide n° 


26 : 


gaa 


gaa 


aat 


gga 


cag 


cag 


TtA 


cca 


tta 


ctg 


tea 


gta 












Glu 


Glu 


Asn 


Gly 


Gin 


Gin 


Leu 


Pro 


Leu 


Leu 


Ser 


Val 








Oligonucleotide n° 


27 : 


gaa 


gaa 


aat 


gga 


cag 


cag 


Ttt 


cca 


tta 


ctg 


tea 


gta 












Glu 


Glu 


Asn 


Gly 


Gin 


Gin 


Phe 


Pro 


Leu 


Leu 


Ser 


Val 








Oligonucleotide n° 


28 : 


cca 


ttg 


tut 


tta 


tta 


aat 


TTa 


TTT 


TTT 


tta 


cca 


tta 


ctg 


tea 


gta 






Pro 


Leu 


Phe 


Leu 


Leu 


Asn 


Leu 


Phe 


Phe 


Leu 


Pro 


Leu 


Leu 


Ser 


Val 


Oligonucleotide n° 


29 : 


cca 


ttg 


ttt 


tta 


tta 


aat 


TTa 


GaA 


GaA 


tta 


cca 


tta 


ctg 


tea 


gta 






Pro 


Leu 


Phe 


Leu 


Leu 


Asn 


Leu 


Glu 


Glu 


Leu 


Pro 


Leu 


Leu 


Ser 


Val 


Oligonucleotide n° 


30 : 


cca 


ttg 


ttt 


gaa 


gaa 


aat 


TTa 


GaA 


GaA 


tta 


cca 


tta 


ctg 


tea 


gta 






Pro 


Leu 


Phe 


Glu 


Glu 


Asn 


Leu 


Glu 


Glu 


Leu 


Pro 


Leu 


Leu 


Ser 


Val 


Oligonucleotide n° 


31 : 


cca 


ttg 


ttt 


gaa 


gaa 


aat 


TTT 


TTA 


TTA 


ttt 


cca 


tta 


ctg 


tea 


gta 






Pro 


Leu 


Phe 


Glu 


Glu 


Asn 


Phe 


Leu 


Leu 


Phe 


Pro 


Leu 


Leu 


Ser 


Val 


Oligonucleotide n° 


32 : 


cca 


ttg 


ttt 


gaa 


gaa 


aat 


'TTT 


GaA 


GaA 


ttt 


cca 


tta 


ctg 


tea 


gta 






Pro 


Leu 


Phe 


Glu 


Glu 


Asn 


Phe 


Glu 


Glu 


Phe 


Pro 


Leu 


Leu 


Ser 


Val 


Oligonucleotide n° 


33 : 


cca 


ttg 


ttt 


tta 


tta 


aat 


TTT 


GaA 


GaA 


ttt 


cca 


tta 


ctg 


tea 


gta 






Pro 


Leu 


Phe 


Leu 


> 

Leu 


Asn 


Phe 


Glu 


Glu 


Phe 


Pro 


Leu 


Leu 


Ser 


Val 


Oligonucleotide n° 


34 : 


cca 


ttg 


ttt 


tta 


tta 


aat 


GAa 


TTT 


TTT 


gaa 


cca 


tta 


ctg 


tea 


gta 






Pro 


Leu 


Phe 


Leu 


Leu 


Asn 


Glu 


Phe 


Phe 


Glu 


Pro 


Leu 


Leu 


Ser 


Val 



La procedure de mutageneses dirigees successives est similaire a la procedure decrite 
dans l'exemple 2. La seule difference reside dans la combinaison des oligonucleotides. Pour 
chacun des mutants decrits dans le tableau 4, les combinaisons successives d'oligonucleotides 
sont decrites ci-apres. 

Mutant n° 10: La creation du mutant n° 10 necessite trois series successives de 
mutageneses dirigees selon le protocole decrit ci-apres en utilisant l'oligonucleotide n°21 lors de 
la premiere mutagenese, l'oligonucleotide n° 23 lors de la deuxieme et l'oligonucleotide n° 28 
lors de la troisieme. L'oligonucleotide n° 23 est defini pour reconnaitre les modifications 
apportces lors de la premiere mutagenese avec l'oligonucleotide n° 21 et l'oligonucleotide n° 28 
est defini pour reconnaitre les modifications apportees lors des deux premieres mutageneses avec 
les oligonucleotides n° 21 et n° 23. 

Mutant n° 11 : La creation du mutant n° 11 necessite trois series successives de 
mutageneses dirigees selon le protocole decrit ci-apres en utilisant ['oligonucleotide n°21 lors de 
la premiere mutagenese, l'oligonucleotide n° 23 lors de la deuxieme et l'oligonucleotide n° 29 
lors de la troisieme. L'oligonucleotide n° 23 est defini pour reconnaitre les modifications 
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apportees lors de la premiere mutagenese avec l'oligonucleotide n° 21 et ['oligonucleotide n° 29 
est defini pour reconnaitre les modifications apportees lors des deux premieres mutageneses avec 
les oligonucleotides n° 21 et n° 23. 

Mutant n° 12: La creation du mutant n° 12 necessite trois series successives de 
mutageneses dirigees selon le protocole decrit ci-apres en utilisant l'oligonucleotide n°22 lors de 
la premiere mutagenese, l'oligonucleotide n° 26 lors de la deuxieme et l'oligonucleotide n° 30 
lors de la troisieme. L'oligonucleotide n° 26 est defini pour reconnaitre les modifications 
apportees lors de la premiere mutagenese avec l'oligonucleotide n° 22 et l'oligonucleotide n° 30 
est defini pour reconnaitre les modifications apportees lors des deux premieres mutageneses avec 
les oligonucleotides n° 22 et n° 26. 

Mutant n° 13: La creation du mutant n° 13 necessite trois series successives de 
mutageneses dirigees selon le protocole ci-apres en utilisant l'oligonucleotide n°22 lors de la 
premiere mutagenese, l'oligonucleotide n° 27 lors de la deuxieme et l'oligonucleotide n° 31 lors 
de la troisieme. L'oligonucleotide n° 27 est defini pour reconnaitre les modifications apportees 
lors de la premiere mutagenese avec l'oligonucleotide n° 22 et l'oligonucleotide n° 31 est defini 
pour reconnaitre les modifications apportees lors des deux premieres mutageneses avec les 
oligonucleotides n° 22 et n° 27. 

Mutant n° 14: La creation du mutant n° 14 necessite trois series successives de 
mutageneses dirigees selon le protocole decrit ci-apres en utilisant l'oligonucleotide n°22 lors de 
la premiere mutagenese, l'oligonucleotide n° 27 lors de la deuxieme et l'oligonucleotide n° 32 
lors de la troisieme. L'oligonucleotide n° 27 est defini pour reconnaitre les modifications 
apportees lors de la premiere mutagenese avec l'oligonucleotide n° 22 et l'oligonucleotide n° 32 
est defini pour reconnaitre les modifications apportees lors des deux premieres mutageneses avec 
les oligonucleotides n° 22 et n° 27. 

Mutant n° 15: La creation du mutant n° 15 necessite trois series successives de 
mutageneses dirigees selon le protocole ci-apres en utilisant l'oligonucleotide n°21 lors de la 
premiere mutagenese, l'oligonucleotide n° 24 lors de la deuxieme et l'oligonucleotide n° 33 lors 
de la troisieme. L'oligonucleotide n° 24 est defini pour reconnaitre les modifications apportees 
lors de la premiere mutagenese avec l'oligonucleotide n° 21 et l'oligonucleotide n° 33 est defini 
pour reconnaitre les modifications apportees lors des deux premieres mutageneses avec les 
oligonucleotides n° 21 et n° 24. 

Mutant n° 16 : La creation du mutant n° 16 necessite trois series successives de 
mutageneses dirigees selon le protocole ci-apres en utilisant l'oligonucleotide n°21 lors de la 
premiere mutagenese, l'oligonucleotide n° 25 lors de la deuxieme et l'oligonucleotide n° 34 lors 
de la troisieme. L'oligonucleotide n° 25 est defini pour reconnaitre les modifications apportees 
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lors de la premiere mutagenese avec l'oligonucleotide n° 21 et l'oligonucleotide n° 34 est defini 
pour reconnaitre les modifications apportees lors des deux premieres mutageneses avec les 
oligonucleotides n° 21 et n° 25. 

Selon ce protocole, les oligonucleotides destines a creer les mutants n° 10 a n° 16 decrits 
dans le tableau 4 sont repartis en trois categories, oligonucleotides de l 6rc serie, oligonucleotides 
de 2* me serie et oligonucleotides de 3 tmc serie. Cette repartition est la suivante : 
Oligonucleotides de l* rc serie : Oligonucleotides n° 21 et 22 
Oligonucleotides de 2 dme serie : Oligonucleotides n° 23, 24, 25, 26 et 27 
Oligonucleotides de 3 6me serie : Oligonucleotides n° 28, 29, 30, 31, 32, 33 et 34 

3-2- Creation de sites de coupure par la pepsine dans la boucle inter-helice alphaS- 
alpha 6 

La substitution de plusieurs acides amines au sein de la boucle inter-helice alphaS -alpha 6 
necessite pour chacun des mutants Tutilisation successive de plusieurs oligonucleotides de 
mutagenese. Les oligonucleotides de mutagenese necessaires a la creation des exemples de 
mutants presentes dans le tableau 5 sont presentes ci-apres (numerates de 35 a 44). 



Oligonucleotide n° 


35 : 


gat 


gca 


tct 


ctt 


ttt 


TTa 


gaa 


gga 


tgg 


gga 


ttc 
















Asp 


Ala 


Ser 


Leu 


Phe 


Leu 


Glu 


Gly 


Trp 


Gly 


Phe 












Oligonucleotide n° 


36 : 


gat 


gca 


tct 


ctt 


ttt 


TTa 


TTa 


gga 


tgg 


gga 


ttc 


aca 














Asp 


Ala 


Ser 


Leu 


Phe 


Leu 


Leu 


Gly 


Trp 


Gly 


Phe 


Thr 










Oligonucleotide n° 


37 : 


gat 


qca 


tct 


ctt 


ttt 


gAa 


gaa 


gga 


tgg 


gga 


ttc 
















Asp 


Ala 


Ser 


Leu 


Phe 


Glu 


Glu 


Gly 


Trp 


Gly 


Phe 












Oligonucleotide n° 


38 : 


t ta 


gaa 


gga 


tgg 


gga 


TTa 


aca 


cag 


ggg 


gaa 


att 
















Leu 


Glu 


Gly 


Trp 


Gly 


Leu 


Thr 


Gin 


Gly 


Glu 


lie 












Oligonucleotide n° 


39 : 


gga 


gaa 


gga 


tgg 


gga 


GAA 


aca 


cag 


ggg 


gaa 


att 
















Gly 


Glu 


Gly 


Trp 


Gly 


Glu 


Thr 


Gin 


Gly 


Glu 


He 












Oligonucleotide n° 


40: 


gca 




ctt 


ttt 


tta 


gaa 


TTa 


tTT 


TTa 


ttc 


aca 


cag 


ggg 


ga 


a 


att 






Ala 


Ser 


Leu 


Phe 


Leu 


Glu 


Leu 


Phe 


Leu 


Phe 


Thr 


Gin 


Giy 


Gl 


u 


lie 


Oligonucleotide n° 


41 : 


gca 


tct 


ctt 


ttt 


tta 


tta 


TTa 


tTT 


TTa 


ttc 


aca 


cag 


ggg 


ga 


a 


att 






Ala 


Ser 


Leu 


Phe 


Leu 


Leu 


Leu 


Phe 


Leu 


Phe 


Thr 


Gin 


Gly 


Gl 


u 


He 


Oligonucleotide n c 


42 : 


gca 


L C 1 


ctt 


tzt 


tta 


gaa 


TTa 


tTT 


TTa 


ttc 


aca 


cag 


ggg 




a 


att 






Ala 




Leu 


Phe 


Leu 


Glu 


Glu 


Phe 


Glu 


Leu 


Thr 


Gl n 


Gly 


o 


u 


He 


Oligonucleotide n° 


43 : 


gca 


— *- 

c 


ctt 


ttu 


gaa 


caa 


TTa 


tTT 


TTa 


ttc 


aca 


C 3 Q 


ggg 


ga 


a 








Ala 


Ser 


Leu 


Phe 


Glu 


Glu 


Glu 


Phe 


Glu 


Leu 


Thr 


Gin 


Gly 


Gl 


u 


He 


Oligonucleotide n° 


44 : 


■^ca 


tct 


czz 


ttt 


gaa 


gaa 


TTa 


tTT 


TTa 


gaa 


aca 


cag 


ggg 


ga 


a 


att 






Aid 


Se r 


Leu 


Phe 


Glu 


Glu 


Glu 


Phe 


Glu 


Glu 


Thr 


Gin 


G 1 y 


/-* ~ 


u 


He 
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La procedure de mutageneses dirigees successives est similaire a la procedure decrite 
dans l'exemple 2. La seule difference reside dans la combinaison des oligonucleotides. Pour 
chacun des mutants decrits dans le tableau 5, les combinaisons successives ^oligonucleotides 
sont decrites ci-apres. 

Mutant n° 17: La creation du mutant n°17 necessite deux series successives de 
mutageneses dirigees selon le protocole decrit ci-apres en utilisant l'oligonucleotide n° 35 lors de 
la premiere mutagenese et l'oligonucleotide n° 40 lors de la seconde. ^oligonucleotide n° 40 est 
defini pour reconnaitre les modifications apportees lors de la premiere mutagenese avec 
l'oligonucleotide n° 35. 

Mutant n° 18: La creation du mutant n° 18 necessite deux series successives de 
mutageneses dirigees selon le protocole decrit ci-apres en utilisant l'oligonucleotide n° 36 lors de 
la premiere mutagenese et l'oligonucleotide n° 41 lors de la seconde. ^oligonucleotide n° 41 est 
defini pour reconnaitre les modifications apportees lors de la premiere mutagenese avec 

Toligonucleotide n° 36. 

Mutant n° 19 : La creation du mutant n° 19 necessite trois series successives de 
mutageneses dirigees selon le protocole ci-apres en utilisant l'oligonucleotide n° 35 lors de la 
premiere mutagenese, l'oligonucleotide n° 38 lors de la deuxieme et l'oligonucleotide n° 42 lors 
de la troisieme. L'oligonucleotide n° 38 est defini pour reconnaitre les modifications apportees 
lors de la premiere mutagenese avec l'oligonucleotide n° 35 et l'oligonucleotide n° 42 est defini 
pour reconnaitre les modifications apportees lors des deux premieres mutageneses avec les 
oligonucleotides n° 35 et n° 38. 

Mutant n° 20 : La creation du mutant n° 20 necessite trois series successives de 
mutageneses dirigees selon le protocole ci-apres en utilisant l'oligonucleotide n°37 lors de la 
premiere mutagenese, l'oligonucleotide n° 38 lors de la deuxieme et l'oligonucleotide n° 43 lors 
de la troisieme. L'oligonucleotide n° 38 est defini pour reconnaitre les modifications apportees 
lors de la premiere mutagenese avec l'oligonucleotide n° 37 et l'oligonucleotide n° 43 est defini 
pour reconnaitre les modifications apportees lors des deux premieres mutageneses avec les 
oligonucleotides n° 37 et n° 38. 

Mutant n° 21 : La creation du mutant n° 21 necessite trois series successives de 
mutageneses dirigees selon le protocole ci-apres en utilisant l'oligonucleotide n° 37 lors de la 
premiere mutagenese, l'oligonucleotide n° 39 lors de la deuxieme et l'oligonucleotide n° 44 lors 
de la troisieme. L'oligonucleotide n° 39 est defini pour reconnaitre les modifications apportees 
lors de la premiere mutagenese avec l'oligonucleotide n° 37 et l'oligonucleotide n° 44 est defini 
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pour reconnaTtre les modifications apportees lors des deux premieres mutageneses avec les 
oligonucleotides n° 37 et n° 39. 

Selon ce protocole, les oligonucleotides destines a creer les mutants n° 17 a n° 21 decrits 
dans le tableau 5 sont repartis en trois categories, oligonucleotides de l* re serie, oligonucleotides 
de 2 dme serie et oligonuc!6tides de 3* me serie. Cette repartition est la suivante : 
Oligonucleotides de l* rc serie : Oligonucleotides n° 35, 36 et 37 
Oligonucleotides de 2* me serie : Oligonucleotides n° 38, 39, 40 et 41 
Oligonucleotides de 3 dmc s6rie : Oligonucleotides n° 42, 43 et 44 



3-3- Creation de sites de coupure par la pepsine dans la boucle inter-helice alpha6- 
alpha 7 1 

La substitution de plusieurs acides amines ati sein de la boucle inter-helice alpha 6-alpha 
7 ne necessite pour chacun des mutants qu'une seule mutagenese. Les oligonucleotides de 
mutagendse necessaires a la creation des exemples de mutants presentes dans le tableau 6 sont 

* 

presentes ci-apres (numerates de 45 a 52). 



Oligonucleotide 


n° 


45 : 


ggt 


tta 


gat 


cgt 


tta 


TTa 


'gAa 


TTa 


aat 


. act 


gaa 


agt 


tgg 








Gly 


Leu 


Asp 


Arg, 


Leu 


Leu 


Xlu 


Leu 


Asn 


Thr 


Glu 


Ser 


Trp 


Oligonucleotide 


n° 


46: 


ggt 


tta 


gat 


cgt 


tta 


TTa 


TTT 


TTa 


aat 


act 


gaa 


agt 


tgg 








Gly 


Leu 


Asp 


Arg 


Leu 


Leu. 


Phe 


Leu 


Asn 


Thr 


Glu 


Ser 


Trp 


Oligonucleotide 


n° 


47 : 


ggt 


tta 


gat 


cgt 


tta 


GAa 

* 


TTa 


TTa 


aat 


act 


gaa 


agt 


tgg 








Gly 


Leu 


Asp 


Arg 


Leu 


Glu 


Leu 


Leu 


Asn 


Thr 


Glu 


Ser 


Trp 


Oligonucleotide 


n° 


48 : 


ggt 


tta 


gat 


cgt 


tta 


TTa 


TTT 


TTT 


aat 


act 


gaa 


agt 


tgg 








Gly 


Leu 


Asp 


Arg 


Leu 


Leu 


Phe 


Phe 


Asn 


Thr 


Glu 


Ser 


Trp 


Oligonucleotide 


n° 


49 : 


ggt 


tta 


gat 


cgt 


tta 


GAa 


GAa 


TTa 


aat 


act 


gaa 


agt 


tgg 








Gly 


Leu 


Asp 


Arg 


Leu 


Glu 


Glu 


Leu 


Asn 


Thr 


Glu 


Ser 


Trp 


Oligonucleotide 


n° 


50: 


ggt 


tta 


gat 


cgt 


tta 


GAa 


TTT 


TTa 


aat 


act 


gaa 


agt 


tgg 








Gly 


Leu 


Asp 


Arg 


Leu 


Glu 


Phe 


Leu 


Asn 


Thr 


Glu 


Ser 


Trp 


Oligonucleotide 


n° 


51 : 


ggt 


tta 


gat 


cgt 


tta 


GAa 


TTT 


GAa 


aat 


act 


gaa 


agt 


tgg 








Gly 


Leu 


Asp 


Arg 


Leu 


Glu 


Phe 


Glu 


Asn 


Thr 


Glu 


Ser 


Trp 


Oligonucleotide 


n° 


52 : 


ggt 


tta 


gat 


cgt 


tta 


GAa 


gAa 


GAa 


aat 


act 


gaa 


agt 


tgg 








Gly 


Leu 


Asp 


Arg 


Leu 


Glu 


Glu 


Glu 


Asn 


Thr 


Glu 


Ser 


Trp 



^oligonucleotide n° 45 est utilise pour creer le mutant n° 22. 
[/oligonucleotide n° 46 est utilise pour creer le mutant n° 23. 
^oligonucleotide n° 47 est utilise pour creer le mutant n° 24. 
^oligonucleotide n° 48 est utilise pour creer le mutant n° 25. 
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^oligonucleotide n° 49 est utilise pour creer le mutant n° 26. 
L'oligonucleolide n° 50 est utilise pour creer le mutant n° 27. 
^oligonucleotide n° 51 est utilise pour creer le mutant n° 28. 
[.'oligonucleotide n° 52 est utilise pour creer le mutant n° 29. 

Le protocole complet de realisation de ces mutants est identique a celui decrit dans 
l'Exemple 2. Ce protocole est commun a chacune des series de mutageneses, seuls 
l'oligonucleotide de mutagenese et Toligonucleotide d'inibition/restauration de la resistance a 
rantibiotique changent. 

Exemple 4 : Creation de sites de coupure par la pepsine au niveau des boucles inter-helices 
alpha 3-alpha 4, alpha 4-alpha 5, alpha 5-alpha 6 et alpha 6-alpha 7 de diverses toxines Cry 

Plusieurs groupes de proteines Cry presentent des similitudes de structure. II s'agit 
notamment des proteines appartenant aux families Cryl, Cry3, Cry4, Cry 7, Cry 8, Cry9, Cry 10, 
Cry 16, Cry 17, Cry 19 ou Cry20. Ces similitudes sont demontrees dans la litterature (Schnepfe/ 
a/., 1998). D'autres proteines Cry non citees dans la litterature peuvent egalement presenter des 
similitudes de structure et de sequence avec ces families. L'Exemple 4 a pour but de demontrer 
I'applicabiiite de l'enseignement de la presente invention, tel qu'exemplifie sur la proteine 
Cry9Cal dans les Exemples 2 et 3, a toutes ces families de structures similaires. 

Les modifications dans les boucles inter-helices decrites dans les Exemples 2 et 3 peuvent 
etre realisees de fa<?on equivalente pour toutes les proteines Cry chez lesquelles on peut identifier 
des boucles inter-helices similaires a celles presentes dans le domaine I de la toxine Cry9Cal. Si 
la localisation et la sequence de ces boucles inter-helices sont definies pour ces diverses toxines 
Cry, il est tres facile pour un expert dans Tart de realiser des modifications similaires a celles 
presentees dans les exemples 2 et 3 a partir des details techniques fournis dans ces memes 
exemples 2 et 3. Dans le present exemple, les elements sont donnes pour permettre la creation de 
sites specifiques de degradation par la pepsine chez les toxines Cry autres que la toxine Cry9Cal 
et notamment les proteines Cryl, Cry 3, Cry4 ? Cry7, Cry8 3 Cry9 ? Cry 10, Cry 16, Cry 17, Cry 19 et 
Cry20. La modification de ces boucles inter-helices pour creer des sites de degradation par la 
pepsine chez les toxines CryK Cry 3, Cry4, Cry 7, Cry 8, Cry 9, Cry 10, Cry 16, Cry 17, Cry 19 ou 
Cry20 necessite de suivre les etapes suivantes : 
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1) Etablir, d'apres les sequences et les localisations des boucles inter-helices presentees 
dans les tableaux 6 a 13 ci-dessous, des listes de mutants possibles possedant un ou plusieurs 
residus leucine, phenylalanine ou acide glutamique comme presente dans les tableaux 1, 4, 5 et 6 
et dans les exemples 2 et 3. 

2) Etablir les sequences des genes mutants en tenant compte de la preference de codons 
de l'organisme hote, et si cet organisme est B. thuringiensis en utilisant preferentiellemnt les 
codons TTA, TTT et GAA pour la leucine, la phenylalanine et l'acide glutamique, 
respectivement. 



3) Synthetiser des oligonucleotides de mutagenese pour modifier la sequence des genes 
codant pour les toxines selectionnees sur le modele de ceux presentes dans les exemples 2 et 3. 

4) Utiliser des stategies de mutageneses simples ou multiples telles que decrites dans les 
exemples 2 et 3 et suivant les protocoles experimentaux decrits en detail dans les exemples 2 et 
3. 

La localisation des boucles inter-helices a3-ct4, a4-a5, a5-a6 et a6-a7 du domaine I et 
leurs sequences sont presentees pour les toxines Cryl, Cry3, Cry I, Cry3, Cry4, Cry7, Cry 8, 
Cry 9, Cry 10, Cry 16, Cry 17, Cry 19 et Cry20 dans les tableaux 7, 8, 9, 10, 1 1, 12 et 13 ci-dessous. 
Ces sequences sont presentees pour chacune des proteines holotypes telles que definies par le 
comite de classification de Bacillus thuringiensis (Crickmore et al. 9 2001). Toutefois, les 
homologies de sequences intra-holotypes, c'est-a-dire a entre les differents sous-types d'un meme 
holotype, etant tres elevees, Thomme du metier saura adapter l'enseignement du present Exemple 
4 a tous les sous-types de proteines Cry. 



Tableau 7. Localisation et sequence de la boucle inter-helice alpha 3- alpha 4 chez les 
proteines Cry l 



Proline 



Cry 1 Aa 
Cry I Ab 
Cry I Ac 
Cry I Ad 
Cry I Ae 
CrylAf 



Sequence en 
Acide amine 

DPTN 
DPTN 
DPTN 
DPTN 
DPTN 
DPTN 



Position sur 
la proline 

120 * 123 
120 * 123 
120 a 123 
120 a 123 
120 a 123 
120 a 123 



S^quencenucleotidique 



gatcctactaat 
gatcctactaat 
gatcctactaat 
gatcctactaat 
gatcctactaat 
gatcctactaat 



Position 
sur le 

gdne 

358 a 369 
358 ^ 369 
358*369 
358 a 369 
358 *369 
358 a 369 
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Crv 1 Ae 


DPTN 


120 a 123 


gatcctactaat 


358 a 369 


CrvlBa 


NRDD 


139 a 142 


aacegtgatgat 


415 a 426 


CrvIBb 


NRND 


144 a 147 


aaccgaaatgat 


430 a 441 


Cp/IBc 


NRND 


144 a 147 


aaccgaaatgat 


430 a 441 


CrvlBd 


NRND 


144 a 147 


aaccgaaatgat 


430 a 441 


CrvlCa 


DPNN 


119 a 122 


gatcctaataat 


355 a 366 


CrvlCb 


DPDN 


119 a 122 


gatcctgataat 


355 a 366 


Crv 1 Da 


DPTN 


119*122 


gatcctactaat , 

4»»J 


355 a 366 


CrvlDb 


DPSN 


119 a 122 


gatcegtctaat 


355 a 366 


Crv I Fa 


DPTN 


1 18 a 121 


gatcctactaat 


352 a 363 


CrvlEb 


DPTN 


1 17 a 120 


gatcctactaat 


349 a 360 


Crv 1 Fa 


NPNN 


1 18 a 121 


aatcctaataat 


352 a 363 


CrvlFb 


NPNN 


118 a 121 


aatcctaataat 


352 a 363 


CrvlGa 


DPNTM 


1 18 a 121 


gatcctaataat 


352 a 363 


Crv 1Gb 


DPDN 


118 a 121 


gatcctgataac 


352 a 363 


Crv 1 Ha 

V-^i Till *-* 


SPNN 


122 a 125 


tctcctaataat 


364 a 375 


CrvlHb 


SPNlsl 


121 a 124 


tctcctaataat 


361 a 372 


Cry 1 la 


NRNN 


148 a 151 


aategtaataac 


442 a 453 


Crv lib 

V^- i T 1 ft 


NRNN 


148 a 151 


aategtaataac 


442 a 453 


Crv lie 


NRMN 


148 a 151 


aategtaataac 


442 a 453 


Crv lid 

1 T ft M.XM 


NRNN 


148a 151 


aategcaataac 

4*^* 


442 a 453 






148 a 151 


aatcscaacaac 


442 a 453 


CrylJa 


DPDN 


1 19 a 122 


gatcctgataac 


355 a 366 


CrylJb 


TPDN 


119 a 122 


actccagataac 


355 a 366 


CrylKa 


NRND 


145 a 148 


aaccgaaatgat 


433 a 444 



Tableau 8. Localisation et sequence de la boucle inter-helice alpha 4- alpha 5 chez les 
proteines Cryl 



Proline 


Sequence en 


Position sur 


Sequence nucleotidique 


Position 




acides amin£ s 


la proline 




sur le 
gene 


CrylAa 


LAVQNYQVPLL 


148 a 158 


ttggcagttcaaaattatcaagttcctctttta 


442 a 474 




FLAVQNYQVPLL 


148 a 158 


tttgcagttcaaaattatcaagttcctctttta 


442 a 474 


CrylAb 


FAVQNYQVPLL 


148 a 158 


ittgcagttcaaaattatcaagttcctctttta 


442 a 474 


Cry I Ac 


FAVQNYQVPLL 


148 a 158 


tttgcagttcaaaattatcaagttcctctttta 


442 a 474 




LAVQNYQVPLL 


148a 158 


ttggcagttcaaaattatcaagttcctctttta 


442 a 474 


Cryl Ad 


FTVQNYQVPLL 


148 a 158 


tttacagttcaaaattatcaagtacctcttcta 


442 a 474 


CrytAe 


FTVQNYQVPLL 


148a 158 


tttacagttcaaaattatcaagtacclcttcta 


442 a 474 


CrylAf 


FAVQNYQVPLL 


148 a 158 


utgcagttcaaaattatcaagttcctctttta 


442 a 474 


CrylAg 


LAVQNYQVPLL 


148 a 158 


uggcagttcaaaattatcaagttcctctttta 


442 a 474 


CrylBa 


FA1RNQEVPLL 


167 a 177 


ttcgcaattagaaaccaagaagttccattattg 


499 a 531 


CryIBb 


FRIRNEEVPLL 


172 a 182 


ttcagaatacgaaatgaagaagttccattatta 


514 a 546 
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Crvl 


1 Be 


FRIRNEFVPLI 


1 7? a ! R? 




S 14 a S46 


Crvl 


i Rd 


FRIRNFFVPI 1 
■ rv i rvj ~ l l v r i .. i_> 


1 7? A 1 QO 




S14 a S46 




ICa 


FttI<>GFFVPI 1 

I r\. 1 OVJ I L. V ILL, 


147 a 1 S7 




4 \Q ^ 47 1 


Crvl 


1 Cb 


FRIACiFFVPI I 


147 A 1 S7 




410 a 47 1 


Crvl 


1 Da 


FRVONYFVAI 1 


147 a 1 S7 
1 *♦ / a 1 J t 




410 a 47 1 


Crvl 


IDb 


LRVRNYFVA1 I 

1— » IX T IX 1 >l 1 L V / \ L L 


147 a 1 S7 




410 a 47 1 


Crvl 


I Ea 

1 L/C* 


I FSVONYOVPFl 


1 4S a 1 


tUUULdgUtwddddUdlLddglvvtdUUld 


411 a 4AR 


Crv 


I Eb 


f FSVOCYFIPI I 

LI L> V Vi'VJ I CiiLL/ 


144 A 1 


^*tt f 1 1 f r* i* o HrQaoottatoQaQttrrfrfftta 
wllllllL'U^llcau^^lUllgaclcil I v. Clcllt la 


4in a 4^<\ 


Crv 


1 Fa 


NFTI T^FFIPI 1 


1 4 <s* A |C£ 

1 *♦ J a 1 jO 


Ik 1 1 '♦"♦t' f3 a* r j ^(t'l^iQn f-f-f- 4 n o o •it , <^r*<^t"/ % t+t't o 

aaiiuaCaciiacaagiiugaaaicccicuiia 


411 i 4^8 
HJ J a ^05 


Crvl 


I Fh 


NFTI T^FFIPI I 


i a i jo 


aauuacaciiacaagiiiigaaaicccicuiia 


J 3 HOo 


Crvl 


(Ha 


TI AFRNI FVVMI 

1 i-rtllMNLE V V IN L 


1 A *\ A 1 ^ 


acniggcaancggaatcugaggiagigaama 


All A /l^fi 


Crvl 


lOh 

1 VJ KJ 


I MAIPCFFI ATI 
L.ivirtir\jr OLA i l 


14< A 1 « 
1 *tj a 1 JO 


cuaiggcaauccaggiiiLgaauagciaciua 


All A 


Crvl 


1 Ha 

1 I let 


I RFOCiFFIPI I 


I JU a 1 OU 


cigdgagaacadggcrugaaaiiccicuiid 


440 A 4CA 


Crvl 


t Hb 


I RFOGFFIPI I 

LIVLV^VJI HILL 


14Q A ICQ 
I 47 a X J3f 


t/LgagdgadCdgggClllgddallLClClLlld 


44^ A 477 


Crvl 


1 la 

i lu 


FAV^CFFVPT 1 

I AY V OVJ CCVrLL 


1 7/C a ic/: 
1 / O a I OO 


ingcagigiciggagaggaggiaccauana 


jzo a jjo 


Crvl 
^iy i 


Tb 


PAVnOPFVP! I 


J / O a I OO 


uigcagiaiciggigaggaagiaccaiiaua 


^7/i A ^^Q 


Crvl 


lv 


FAV^PtFPVPl 1 


I 7A A 1 RA 
1 / O a J OO 


iiigcagiaiciggigaggaagiaccanaiia 


co/; a 

jzo a jjo 


Crvl 


Id 


FAV^sOFFVPI I 

I /A V OVJ L L Y ILL 


17/; A 1 OA 
1 / O d 1 OO 


ttigcs&ttictggagaagaggigccgCLana 


jzo a jjo 


Cryl 


lie 


FAVSGEEVPLL 


176 a 186 


tttgcagtatcaggtgaggaagtaccattattg 


526 a 558 


Cryl 


Ja 


FRIIGFEVPLL 


147 a 157 


tttcggataattggatttgaagtgccactttta 


439 a 471 


Cryl 


Jb 


FRJPGFEVPLL 


147a 157 


tttcggattcccggatttgaagtgccacttcta 


439 a 471 


Cryl 


Ka 


FSIRNEEVPLL 


173 a 183 


ttcagcatacgaaacgaagaggttccattatta 


517 a 549 



Tableau 9. Localisation et sequence de la boucle inter-helice alpha 5- alpha 6 chez les 
proteines Cryl 



Proline 


Sequence en 


Position sur 


Sequence nucl^otidique 


Position 




Acide amin6 


la prot&ne 




sur le gene 


Cryl Aa 


FGQRWGFD 


178 a 185 


tttggacaaaggtggggatttgat 


532 a 555 


CrylAb 


FGQRWGFD 


178a 185 


tttggacaaaggtggggatttgat 


532 a 555 


Cryl Ac 


FGQRWGFD 


178a 185 


tttggacaaaggtggggatttgat 


532 a 555 


Cryl Ad 


FGQRWGFD 


178a 185 


tttggacaacgttggggatttgat 


532 a 555 


Cry 1 Ae 


FGQRWGLD 


178 a 185 


rttggacaacgttggggacttgat 


532 a 555 


CrylAf 


CGQRSGFD 


175 a 182 


tgtggacaaaggtcgggatttgat 


523 a 546 


Cryl Ag 


FGQRWGFD 


178a 185 


tttggacaaaggtggggatttgat 


532 a 555 


Cry I Ba 


FGSEFGLT 


197 a 204 


tttggtagtgaatttgggcttaca 


589 a 612 


Crv 1 Bb 

* 


FGSEWGMA 


202 a 209 


tttgglagtgaatgggggatggca 


604 a 627 


Cry 1 Be 


FGSEWGMA 


202 a 209 


tttggtagtgaatgggggatggca 


604 a 627 


Cry I Bd 


FGSEWGMA 


202 a 209 


tttggtagtgaatgggggatggca 


604 a 627 


CrvlCa 


FGERWGLT 


177 a 184 


tttggagaaagatggggattgaca 


529 a 552 




FGERWGVT 


177 a 184 


tttggagaaagatggggagtgaca 


529 a 552 


CrvlCb 


FGARWGLT 


177 a 184 


tttggagcaagatggggattgaca 


529 a 552 


Crv l Da 


FGERWGYD 


177 a 184 


ttcggagaaagatggggatatgat 


529 a 552 
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Cry 1 Db YGQRWGFD 177 * 184 tacggtcagagatggggctttgac 529 * 552 

Cry 1 Ea FGQAWGFD 1 76 a 1 83 tttgggcaggcttggggatttgat 526 * 549 

Cry 1 Eb FGQRWGFD 1 75 a 1 82 tttggacaacgttggggatttgat 523 a 546 

Cry 1 Fa FGQGWGLD 1 76 a 1 83 tttgggcagggttggggactggat 526 * 549 

Cry 1 Fb FGQGWGLD 1 76 a 1 83 tttgggcagggttgggggctggat 526 * 549 

Cry IGa FGERWGLT 1 76 a 1 83 tttggagaaagatggggattaaca 526 * 549 

Cry 1 Gb FGERWGLT 1 76 * 1 83 tttggggagagatggggattgaca 526 * 549 

Cry 1 Ha FGQRWGLD 1 80 * 1 87 tttgggcaaagatggggacttgac 538 a 56 1 

Cry I Hb FGQRWGLD 1 79 * 186 tttggacagagatggggacttgat 535 * 558 

Cry 1 la FGKEWGLS 206 * 2 1 3 tttggaaaagagtggggattatca 6 1 6 * 639 

Cry I lb FGKEWGLS 206 k 213 tttggaaaagaatggggattatca 616 k 639 

Cry i Ic FEKNGGLS 206 k 2 1 3 tttgaaaagaatgggggattatca 6 1 6 k 639 

Cry 1 Id FGKEWGLS 206 k 2 1 3 tttggaaaagaatggggattgtca 6 1 6 k 639 

Cry I Ie FGKEWGLS 206 a 2 1 3 tttggaaaagagtggggattatct 616 & 639 

Cry 1 Ja FGERWGLT 1 77 k 1 84 tttggagagagatggggattgacg 529*552 

Cry 1 Jb FGERWGLT 1 77 k 1 84 ttcggagagagatggggattgacg 529 k 552 

Cry lKa FGSEWGMS 203 k 210 tttggtagtgaatgggggatgtca 607 k 630 

Tableau 10, Localisation et sequence de la boucle inter-helice alpha 6- alpha 7 chez 
proteines Cryl 

Proline Sequence en Position sur Sequence nucteotidique Position 

Acide aming la proline sur le gene 

CrylAa VWGPD 218*222 gtatggggaccggat 652*666 

CrylAb VWGPD 218*222 gtatggggaccggat 652*666 

Cryl Ac VWGPD 218*222 gtatggggaccggat 652*666 

Cryl Ad VWGPD 218*222 gtatggggaccggat 652*666 

CrylAe VWGPD 218*222 gtatggggaccggat 652*666 

CrylAf VWGPD 215*219 gtatggggaccggat 643 *657 

CrylAg VWGPD 218*222 gtatggggaccggat 652*666 

CryiBa LRGTN 237*241 ttgagagggacaaat 709*723 

CrylBb LRGTN 242*246 ttaagagggacaaat 724*738 

Cryl Be LRGTN 242*246 ttaagagggacaaat 724*738 

CrylBd LRGTN 242*246 ttaagagggacaaat 724*738 

CrylCa LPKST 217*221 ttaccgaaatctacg 649*663 

CrylCb LPKST 217*221 ttaccaaaatctacg 649*663 

Cryl Da LEGRF 217*221 ttggaaggtcgtttt 649*663 

CrylDb LFGSR 217*221 ttagagggatctcga 649*663 

CrylEa LPRTGG 216*221 ttaccacgaactggtggg 646*663 

Cry 1 Eb LPRNEG 2 1 5 * 220 ttaccacgtaatgaaggg 643 * 660 

Cry I Fa LRGTNT 216*221 ttaagaggtactaatact 646*663 

CrylFb LRGTNT 216*221 ttaagaggtactaatact 646*663 

Cry IGa IGGIS 216*220 attggagggataagt 646*660 
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CrylGb 


LNVIR 


216 a 220 


ttaaatgttataaga 


646 a 660 


Cry 1 Ha 


FGGVS 


220 a 224 


tttggtggtgtgtca 


658 a 672 


CrylHb 


FT3VVT 


219a223 


tttggtgttgtaaca 


655 a 669 


Cry 1 la 


LRGTN 


246 a 250 


ttgaggggtacaaat 


736 a 750 


Cry lib 


LRGTN 


246 a 250 


ttgaggggtacaaat 


736 a 750 


Cry lie 


LRATN 


246 a 250 


ttgagggctacaaat 


736 a 750 


Cry I Id 


LRGTN 


246 a 250 


ttgaggggaacaaat 


736 a 750 


Cry lie 


LRGTN 


246 a 250 


ttgagaggtacaaat 


736 a 750 


CryIJa 


LGFRS 


217a221 


ctagggtttagatct 


649 a 663 


CrylJb 


LGFTS 


217a221 


ctagggtttacttct 


649 a 663 


CrylKa 


LRGTT 


243 a 247 


ttaagagggacaact 


727 a 741 



Tableau 11. Localisation et sequence de la boucle inter-helice alpha 3- alpha 4 chez les 
proteines Cry3, Cry4, Cry7, Cry8, Cry9, CrylO, Cryl6, Cryl7, Cryl9 et Cry20 



Proteine 


Sequence en 


Position sur 


Sequence nucl£otidique 


Positi n 




acide amine 


la proline 


** 


sur le 
gene 


Cry3Aa 


NPVSSRN 


153 a 159 


aatcctgtgagttcacgaaat 


A CI X A *T"T 

457 a 477 


Cry3Ba 


a n\ rw ft no 

APVNLRS 


154 a 160 


^cgcctgtaaatttacgaagt 


460 a 480 


Cry3Bb 


TPLSLRS 


154 a 160 


acacctttaagtttgcgaagt 


460 a 480 


Cry3Ca 


TPLTLRD 


151 a 157 


actcctttgactttacgagat 


451 a471 


Cry4Aa 


NNPNPQNTQD 


160 a 169 


aataatccaaacccacaaaatactcaggat 


478 a 507 


Cry4Ba 


EPNNQSYRTA 


136 a 145 


gagcctaataaccagtcctatagaacagca 


406 a 435 


Cry7Aa 


KQDDPEAILS 


147 a 156 


aaacaagatgatccagaagctatactttct 


439 a 468 


Cry7Ab 


NPDDPATITR 


147 a 156 


aatcctgatgatccagcaactataacacga 


439 a 468 


Cry8Aa 


NRNDARTRSV 


158 a 167 


i 

aatcgcaatgatgcaagaactagaagtgtt 


472 a 501 


Cry8Ba 


NPNGSRALRD 


159 a 168 


aatccaaatggttcaagagccttacgagat 


475 a 504 


Cry8Ca 


NPHSTRSAAL 


159 a 168 


aacccacacagtacacgaagcgcagcactt 


475 a 504 


Cry9Aa 


NPNSASAEEL 


146 a 155 


aatcctaattctgcttctgctgaagaactc 


436 a 465 


Cry9Ba 


RPNGVRANLV 


134 a 143 


agaccaaacggcgtaagagcaaacttagtt 


400 a 429 


Cry9Ca 


DRNDTRNLSV 


159a 168 


gatcgaaatgatacacgaaatttaagtgtt 


475 a 504 


Cry9Da 


RPNGARASLV 


159 a 168 


agaccaaatggcgcaagggcatccttagtt 


475 a 504 


Cry9Ea 


RPNGARANLV 


159 a 168 


agaccgaacggagcaagagctaacttagtt 


475 a 504 


CrylOAa 


ARTHANAKAV 


162a 171 


gcacgtacacacgctaatgctaaagcagta 


484a5I3 


Crvl6Aa 


NYNPTSIDDV 


109a 118 


aattataatccaacttctatagacgatgta 


325 a 354 


Crvl7Aa 

MP 


NKDDPLAIAEL 


127 a 137 


aataaagatgaccccttggctatagctgaatta 


379 a 411 


CrvI9Aa 


DPKSTGNLSTL 


159 a 169 


gatccaaaatctacaggtaatttaagcacctta 


475 a 507 


Cryl9Ba 


NKNNFASGEL 


151 a 160 


aataaaaataatttcgcaagtggtgaactt 


451 a 480 


Cry20Aa 


ERNRTRENGQ 


141 a 150 


gaacgtaatagaactcgtgaaaacggacaa 


421 a 450 
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Tableau 12. Localisation et sequence de la boucle inter-helice alpha 4- alpha 5 chez les 
proteines Cry3, Cry4, Cry7, Cry8, Cry9, CrylO, Cryl6, Cryl7, Cryl9 et Cry20 

Proline Sequence en Position Sequence nucleotidique 

acide amine surla proteine 



Cry3Aa ISGYEVL 

Cry3Ba VSKFEVL 

Cry3Bb VSKFEVL 

Cry3Ca VSGYEVL 
Cry4Aa 



1 86 * 1 92 atttctggatacgaggttcta 

1 87 a 1 93 gtttccaaattcgaagttctg 
187 a 193 gtttccaaattcgaagtgctg 
184 * 190 gtctctggatacgaagttcta 

LVNSCPPNPSDCDYYNILVL . 188 * 207 
cttgtaaactcttgtcctcctaatcctagtgattgcgattactataacatactagtatta 



Position 
sur le 
gene 

556 a 576 
559 a 579 
559*579 
550*570 



562 £ 621 



Cry4Ba 


FSNLVGYELLLL 


164* 175 


tttagcaacttagtaggttatgaattattgttatta 


490 * 525 


Cry7Aa 


FKVTGYEIPLL 


175* 185 


tttaaggttactggatatgaaataccattacta 


523 * 555 


Cry7Ab 


FRVAGYEIPLL 


175 * 185 


tttagggttgctggatatgaaataccattacta 


523 * 555 


Cry8Aa 


FAVSGHEVLLL 


186* 196 


tttgcagtatccggacacgaagtactattatta 


556 * 588 


Cry8Ba 


FRVTNFEVPFL 


187* 197 


tttcgagtgacaaattttgaagtaccattcctt 


559*591 


Cry8Ca 


FSQTNYETPLL 


187*197 


ttttctcaaacgaattatgagactccactctta 


559 * 591 


Cry9Aa 


LTNGGSLARQNAQILLL 175 * 191 


ttaacgaatggtggctcgttagctagacaaaatgcccaaatattattatta 


523 * 571 


Cry9Ba 


FGSGPGSQRFQAQLL 


161 * 175 


tttggtagtggccctggaagtcaaaggtttcaggcacaattgttg 


481 *525 


Cry9Ca 


FAVNGQQVPLL 


187* 197 


tttgcagtaaatggacagcaggttccattactg 


559 *591 


Cry9Da 


FGSGPGSQNYATILL 


186 * 200 


tttggctctggtcctggaagtcaaaattatgcaactatattactt 


556 * 600 


Cry9Ea 


FG TGPGSQRDAVALL 


186 * 200 


tttggtacgggtcctggtagtcaaagagatgcggtagcgttgttg 


556 * 600 


CrylOAa 


LKNNASYR1PTL 


1 89 a 200 


ttaaaaaataatgctagctatcgaataccaacactc 


565 * 600 


Cryl6Aa 


FKVKNYEVTVL 


136* 146 


tttaaggttaaaaattatgaagtaacagtgtta 


406*438 


Cryl7Aa 


FKRANYEVLLL 


155 a 165 


tttaaaagggcgaattatgaagtcttactatta 


463 * 495 


Cryl9Aa 


VNNQGSPGYELLLL 


187 *200 


gttaataatcaggggagtccaggttatgagttacttttattg 


559 * 600 


Cryl9Ba 


FSLGGYETVLL 


180* 190 


ttctcattaggaggttatgaaacagtattatta 


538 * 570 


Crv20Aa 


LSRRGFETLLL 


173 a 183 


ctttctcgcagaggattcgaaactcttttatta 


517 * 549 



I *. ■ . 
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Tableau 13. Localisation et sequence de la boucle inter-helice alpha 5- alpha 6 chez les 
proteines Cry3, Cry4, Cry7, Cry8, Cry9, Cry 10, Cry 16, Cry 17, Cry 19 et Cry20 



Prot£inp 


.^nii^n^p pn 

LJUtllV-V VII 


Position sur Sequence nucl6otidique 






Acide amin£ 


la proline 




sur le 










g£ne 


Cry3Aa 


GEEWGYE 


2!5a22l 


ggagaagaatggggatacgaa 


643 a 663 


Cry3Ba 


GEEWGYS 


216 a 222 


ggagaagaatggggatattct 


646 a 666 


Cry3Bb 


GEEWGYS 


216 a 222 


ggagaagaatggggatattct 


646 a 666 


Cry3Ca 


GTDWGYS 


213 a219 


ggaacggattggggatattct 


637 a 657 


Cry4Aa 


FEAYLKNNRQFDYLE 227 a 241 










tttgaagcgtatttaaaaaacaatcgacaattcgattatttagag 


679 a 723 


Cry4Ba 


LINAQEWSL 


193 a 201 


ctcataaatgcacaagaatggtcttta 


577 a 603 




PHKCTRMVY 


193 0 201 


cctcataaatgcacaagaatggtctat 


577 a 603 


Cry7Aa 


GDKWGF 


206 a 211 


ggagataaatggggattc 


616a633 




GDKWEF 


206 a 211 


ggagataaatgggaattc 


616 a 633 


Cry7Ab 


GDFCWGF 


206 a 211 


ggagataaatggggattc 


616 a 633 


Cry8Aa 


GEEWGF 


217 a 222 


ggagaagagtggggattt 


649 a 666 


Cry8Ba 


GEEWGL 


218a223 


ggagaagaatggggattg 


652 a 669 


Cry8Ca 


GKEWGY 


218a223 


gggaaggaatggggatat 


652 a 669 


Cry9Aa 


RYGTNWGL 


2I0a217 


agatatggcactaattgggggcta 


628 a 651 


Cry9Bal 


JCYGARWGL 


194 a 201 


aagtatggggcaagatggggactc 


580 a 603 


Cry9Ca 


LFGEGWGF 


216a223 


ctttttggagaaggatggggattc 


646 a 669 


Cry 9 Da 


IYGARWGL 


219a226 


atttatggagctagatgggggctg 


655 a 678 


Cry9Ea 


IYGARWGL 


219 a 226 


atctatggggcaagatggggactt 


655 a 678 


CrylOAa 


TYYNIWLQ 


2 19 a 226 


acctattacaatatatggctgcaa 


655 a 678 


Cry !6Aa 


IYGDAWNLYRELGF 


165 a 178 atttatggagatgcatggaatttatatagagaattaggattt 


493 a 534 


Crvl7Aa 


LLNKVIDNF 


184 a 192 


cttttaaataaagttatagataatttt 


550 a 576 


Cryl9Aa 


1YGDKWWSA 


219 a 227 


atttatggagataaatggtggagcgca 


655 a681 


Cry !9Ba 


IYGKELG 


209a215 


atttacggaaaagaattagga 


625 a 645 


Cr>20Aa 


LYRNQWL 


202 a 208 


ctttatagaaatcaatggtta 


604 a 624 
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Tableau 14. Localisation et sequence de la boucle inter-helice alpha 6- alpha 7 chez les 
proteines Cry3, Cry4, Cry7, Cry8, Cry9, CrylO, Cryl6, Cryl7, Cryl9 et Cry20 



Proline 


Sequence en 


Position sur 


Sequence nucleotidique 


Position 




Acide amin^ 


la proline 


• 


sur le 


Cry3Aa 


RGSS 


255 a 258 


agaggttcatct 


763 a 774 


Cry3Ba 


RGST 


256 a 259 


agaggttcaact 


766 a 777 


Cry3Bb 


RGST 


256 a 259 


agaggttcaact 


766 a 777 


Cry3Ca 


RGST 


253 a 256 


agaggttcgact 


757 a 768 


Cry4Aa 


L1KTTPD 


274 a 280 


ttaattaaaacgacgcctgat 


820 a 840 


Cry4Ba 


LRNKS 


235 a 239 


cttagaaataaatct 


703 a 717 


Cry7Aa 


LNGST 


245 a 249 


ttgaacggttccact 


733 a 747 


Cry7Ab 


LNGST 


245 a 249 


ttgaacggttccact 


733 a 747 


Cry8Aa 


LKGTT 


256 a 260 


ttgaaaggtaccact 


766 a 780 


Cry8Ba 


LKGSS 


257 a 261 


ttaaaaggctcgagc 


769 a 783 


Cry8Ca 


LRGTG 


257 a 261 


ttaagaggaacgggt 


769 a 783 


Cry9Aa 


LRQRGTS 


252 a 258 


ctaagacaacgaggcactagt 


754 a 774 


Cry9Bal 


LRGTS 


236 a 240 


ttacgaggaacgagc 


706 a 720 


Cry9Ca 


LRGTN 


257 a 261 


ttaagaggaacaaat 


769 a 783 


Cry9Da 


LRGTT > 


260 a 264 


ttaagaggcacaacc 


778 a 792 


Cry9Ea 


VRGTN 


260 a 264 


gtaagaggaacaaat 


778 a 792 


CrylOAa 


IRTNT 


267 a 271 


attagaactaatact 


799 a 813 


Cryl6Aa 


LKLDP7M 


2I0a215 


ttaaaactagatccgaat 


628 a 645 


Cryl7Aa 


IKNKTRDF 


224 a 23 1 


ataaaaaataaaactagggatttt 


670 a 693 


Cryl9Aa 


FRTAG 


26 1 a 265 


tttagaacagcaggt 


781 a 795 


Cryl9Ba 


KKQIG 


250 a 254 


aaaaaacaaatagga 


748 a 762 


Cry20Aa 


DRSS 


245 a 248 


gatcgttcaagt 


733 a 744 



Des mutants peuvent etre prepares pour chacun des genes cry cites dans cet exemple sur 
le modele des exemples 1 , 2 et 3. Les procedures techniques utilisables pour la mise en oeuvre de 
la mutagenese sont similaires celles presentees dans les exemples 1, 2 et 3. 

Exemple 5 : Augmentation globale du contenu en leucine, phenylalanine et acide glutamique 
des proteines Cry 

L'augmentation globale du contenu en leucine, phenylalanine el acide glutamique des 
proteines Cry est decrite ci-apres pour la toxine Cry9Cal. Bien que cet exemple soit realise sur la 
proteine Cry9Cal et le gene crv9CaJ 9 son enseignement est applicable a toutes Ics toxines Cry et 
tous les genes cry. Cet enseignement s'applique notamment a toutes les toxines Cry dont la 
sequence est connue et deposce dans la base de donnees Genbank: 
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http://www.ncbi.nlrn.nih.gov/Gcnbank/index.htmK 

Les numeros d'accession de Genbank des genes cry sont disponibles sur le site suivant : 
http://www.biols.susx.ac.uk/Home/Neil Crickmore/Bt/index.html. 

Cet enseignement s'applique egalement a toutes les toxines Cry et genes cry dont la 
sequence n'est pas divulguee sur Genbank. 

A la difference des strategies decrites dans les exemples 1 a 4, 1'objectif n'est pas de modifier 
une region precise de la toxine pour integrer des acides amines reconnus par la pepsine mais 
d'augmenter globalement le nombre de ces sites par augmentation du taux de leucine, de 
phenylalanine et d'acide glutamique dans ladite toxine. Cette strategic permet de rendre la toxine 
Cry plus sensible a la pepsine en augmentant le pourcentage de residus reconnus par la pepsine. 
L'acide glutamique (E-Glu) est pr^ferentiellement substitue a l'acide aspartique (D-Asp), la 
phenylalanine (F-Phe) remplace preferentiellemeht le tryptophane (W-Trp) et la leucine (L-Leu) 
remplace de preference la valine (V-Val) ou 1'isoleucine (I— He). Cette strategic a necessite la 
creation d'un modele tridimensionnel de la toxine Cry9Cal activee cree a partir de la sequence 
primaire de la proteine par comparaison avec les structures tridimensionnelles de CrylAal et 
Cry3Aal. Le modele a ete cree en utilisant le serveur Swiss-Model Protein Modelling Server 
(Peitsch, 1995; Peitsch, 1996; Guex and Peitsch, 1997). L'adresse du serveur est la suivante : 
( http://www.expasv.ch/swissmod/swiss-model.htmn . 

De facon preferentielle, les substitutions doivent atteindre un niveau maximum de 25 %. La 
toxine Cry9Cal activee contient 31 acides aspartiques, 9 tryptophanes et 47 valines. II y a 
naturellement 26 acides glutamiques, 35 phenylalanines et 61 leucines. En tenant compte d'un 
maximum de 25% de substitution pour chacun des acides amines, les rapports relatifs sont les 
suivants: 

Acide amine Nombre de residus Nombre de residus 



dans Cry9Cal native 



dans Cry9Cal modifiee 



Asp (D) 
Glu (E) 
Trp (W) 
Phe (F) 
Val (V) 
Leu (L) 



47 



61 



35 



9 



26 



31 



72 



36 



24 



7 



37 



33 
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La substitution de l'isoleucine (I-Ile) par la leucine peut egalement etre envisagee en place 
ou en plus de la substitution de la valine par la leucine. II y a naturellement 27 isoleucines dans la 
toxine Cry9Cal. En tenant compte d'un taux de substitution preferentiel de 25%, il suffit de 
remplacer 6 residus isolecine par des leucines. 

» 

II est possible de modifier la sequence du gene cry9Cal comme montre ci-apres. La 
demonstration ci-apres n'a pour seul objectif que d'illustrer l'exemple et ne limite en rien la portee 
de Tinvention. Cette demonstration porte sur le remplacement de residus acides aspartique, 
phenylalanines et valines. Un homme du metier peut tres facilement adapter cette approche a tout 
autre gene cry dont il connaitrait la sequence et notamment a partir des sequences disponibles sur 
Genbank et dont les numeros d'accessions sont mentionnes sur le site suivant: 

httpy/wvsw.biols.susx^ac.uk/Home/Neil Crickmore/Bt/index.html 

Les genes cry generalement exprimes dans les plantes transgeniques sont des genes 
tronques, c'est a dire que seule la sequence du gene codant pour la toxine activee est introduite dans 
ces plantes. Les sequences presentees dans cet exemple correspondent a cette version tronquee et 
s'etendent selon le cas, gene ou proteine, du codon d'initiation ou de la premiere methionine a 1 5 
codons ou acides amines en aval du bloc conserve 5 qui limite la toxine activee. 

La sequence du gene cry9Cal natif et tronque est presentee dans la SEQ ID NO 1 . 

La sequence de la proteine Cry9Cal native et tronquee est presentee dans la SEQ ID NO 2. 

La sequence d'un gene cry9Cal modifie dans lequel tous les codons codant pour les residus 
valine, acide glutamique et phenylalanine ont ete modifie est presentee dans la figure 1 (SEQ ID 
NO 9). Cette sequence modifiee est utilisable comme base pour la definition des divers 
oligonucleotides de mutagenese pouvant etre utilises. Les bases modifiees sont representees en 
caracteres gras. 

La sequence d'une proteine Cry9Cal modifiee dans laquelle tous les residus valine, acide 
glutamique et phenylalanine ont ete modifies est presentee dans la figure 2 (SEQ ID NO 10)es 
acides amines modifies sont representees en caracteres gras. 

L'ensemble des oligonucleotides de mutagenese pouvant permettre de remplacer les residus 
valine, phenylalanine et acide glutamique sont presentes dans la figure 3 ( SEQ ID NO 94 a 160). 
Les bases modifiees sont representees en caracteres gras. 

Une possibility d'utilisation de certains oligonucleotides pour creer un gene cry9Cal modifie 
dont le remplacement des codons codant pour les residus valine, phenylalanine et acide glutamique 
a ete realise a hauteur de 25% est presentee ci-apres a titre illustratif. Cette illustration a pour 
objectif d'exemplifier la strategic developpee sans limiter la portee de Tinvention. Sur la base de 
I'enscignement de cet exemple et des figures 1 a 3 (SEQ ID NO 9 et 10), l'homme du metier saura 
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adapter d'autres combinaisons des oligonucleotides presentes dans la figure 5 (SEQ ID NO 94 a 
160) ou d'autres oligonucleotides prepares sur le meme principe, en particulier pour le 
remplacement des residus isoleucine. 

La sequence d'un gene cry9Cal modifie par remplacement des codons codant pour les 
residus valine, phenylalanine et acide glutamique a hauteur de 25% est presentee dans la figure 4 
(SEQ ID NO 1 1). Les bases modifiees sont en gras. 

La sequence d'une proteine Cry9Cal modifiee par remplacement des residus valine, 
phenylalanine et acide glutamique a hauteur de 25% est presentee dans la figure 5 (SEQ ID NO 12). 
Les acides amines modifies sont en gras. 

La creation d ! un gene cry9Cal modifies dans lequel 25% des codons valine, phenylalanine 
et acide glutamique sont modifies et dont la sequence est presentee en figure 4 (SEQ ID NO 1 1) 
peut etre realisee en utilisant, parmi ceux presentes dans la figure 5 (SEQ ID NO 94 a 160), les 
oligonucleotides suivants : 



Ol 
Ol 
Ol 
Ol 
Ol 
Ol 
Ol 
Ol 
Ol 
Ol 
Ol 
Ol 
Ol 
Ol 
Ol 
01 



gonucleotide n°60 
gonucleotide n°62 
gonucleotide n°67 
gonucleotide n°72 
gonucleotide n°77 
gonucleotide n°78 
gonucleotide n°80 
gonucleotide n°82 
gonucleotide n°83 
gonucleotide n°88 
gonucleotide n°90 
gonucleotide n°92 
gonucleotide n°96 
gonucleotide n°97 
gonucleotide n°103 
gonucleotide n°l 1 1 



La methode preferentiellement utilisee est une mutagenese multiple avec un melange des 
oligonucleotides mentionncs immediatement ci-dessus. La procedure de mutagenese dirigee est 
similaire celle deerite dans l'exemple 1 a la seule difference qu'un melange d'oligonucleotides de 
mutagenese est utilise dans cet exemple alors qu'un seul oligonucleotide de mutagenese est utilise 
dans l'exemple I. Le protocole employe est celui decrit dans les exemples 1 a 4. II est commun a 
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■ * • 

chacune des series de mutageneses, seuls ^oligonucleotide de mutagenese et l'oligonucleotide 

d'inibition/restauration de la resistance a l'antibiotique chahgent. 

Exemple 6 : Production des proteines Cry modifiees dans B. thuringiensis et purification 

Lcs genes natifs et modifies sont inseres avec leurs sequences promotrices et terminatrices 
dans le vecteur navette E. coli-B. thuringiensis pHT3101 (Lereclus et al., 1989). 

L'ADN plasmidique est prepare par minipreparation selon la technique de la lyse alcaline 
(Birboim et Doly, 1979). Chaque colonie bacterienne est cultivee dans 2 ml de milieu LB 
additionne de l'antibiotique approprie pendant une nuit a 37 °C avec agitation (200 rpm). La culture 
est ensuite transferee dans un microtube puis centrifugee a 13500 g pendant 5 min. Apres 
elimination du surnageant, les bacteries sont resuspendues dans 1 OOpl d'une solution de 25mM Tris- 
HC1, pH 8, lOmM EDTA contenant de la Rnase A a la concentration finale de 100 ug/ml. 200 pi 
d'une solution de NaOH 0,2M, 1% SDS sont rajoutes et la suspension est melangee deux fois par 
inversion du microtube. 150 pi d'une solution d'acetate de potassium 2,55 M, pH 4,5 sont rajoutes et 
la suspension est incubee 5 min dans la glace. Apres une centrifugation de 15 min a 13500 g, le 
surnageant est transfere dans un microtube contenant 1 ml d'ethanol froid. Apres une centrifugation 
de 30 min. a 13500 g, le surnageant est elimine et le culot lave avec 1 ml d'ethanol 70%. Le culot 
contenant I'ADN est seche quelques minutes sous vide puis repris dans 50 pi d'eau distillee sterile. 
Les echantillons sont ensuite places a 65°0 pendant 30 min. 

* 

Les digestions par endonucleases de restriction sont realisees pour 1 pg d'ADN dans un 
volume final de 20 pi en presence d'un dixieme de volume final de tampon 10X conseille par le 
fournisseur pour chaque enzyme et a 1'aide de 5 unites d'enzyme. La reaction est incubee pendant 2 
a 3 h a la temperature optimale pour 1'enzyme. 

La dephosphorylation des extremites 5' engendrees par une enzyme de restriction est realisee 
avec la phosphatase alcaline d'intestin de veau. La reaction se fait en utilisant 5 pi de tampon de 
dephosphorylation 10X (500 mM Tris-Hcl, pH 9,3, 10 mM MgCl 2 , ImM ZnCl 2) 10 mM 
spermidine) et une unite d'enzyme par pg d'ADN dans un volume final de 50 pi. La reaction est 
incubee pendant une heure a 37°C dans la cas d'extremites 5' sortantes ou a 55°C dans la cas 
d'extremites franches ou 3' sortantes. Apres la dephosphorylation. 1'enzyme est ensuite inactivee 
pendant 30 min. a 65°C puis eliminee avec deux extractions volume a volume avec un melange de 
phenol-chloroforme-alcool isoamylique (25-24-1). Les ligatures sc font a l'aide de l'ADN ligase du 
phage T4. file est realisee avec une quantite de vecteur egale a 100 ng et un rapport molaire 
insert/vecteur compris entre 5 ct 10. Le volume final de la reaction est de 30 pi et comprend 3 pi de 
tampon de ligature 10X (300 mM Tris-Hcl, pH 7,8, 100 mM MgC12, 100 mM DTL.10 mM ATP) 
et 3 unites d'enzyme. La reaction est incubee une nuit a 14°C. 

l.a construction est inserec dans une souche acristallophore dc B. thuringiensis selon une 
mcthodc dcrivee de celle decrite en 1989 par Lereclus et al et decrite par ailleurs (Rang et al., 
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1999, 2000). Une preculture de Bacillus thuringiensis subsp. kursiaki HD-1 acristallophore est 
incubee une nuit a 37°C sous agitation dans 10 ml de milieu BHI (Difco). 250 ml de milieu BHI 
sont ensuite inocules avec 5 ml de preculture et incubes a 37°C sous agitation jusqu'a ce que la 
DO a 600 nm de la culture atteigne la valeur de 0,3. La culture est alors centrifugee a lOOOg a 
4°C pendant 10 min. Le surnageant est elimine et le culot bacterien est rince avec 50 ml d'eau 
distillee sterile froide. Les bacteries sont centrifugees a nouveau pendant 10 min a lOOOg a 4°C. 
Le culot est repris dans 4 ml d'une solution froide et sterile de PEG-6000 40% et place dans de la 
glace. 200 jal de bacteries sont alors melanges avec 5 \xg d'ADN plasmidique puis placees dans 
une cuvette d'electroporation de diametre 0,2 cm. La cuvette est alors placee dans la chambre 
d'electroporation et un courant correspondant aux caracteristiques suivantes: 2,5 kV, 1000 Q, 25 
jiF est delivre. Les bacteries sont ensuite recuperees, placees 10 min. dans de la glace avant 
d'etre additionnees a 2 ml de milieu BHI et incubees a 37°C sous agitation pendant 90 min. 200 
111 de culture sont alors etales sur des boites de Petri contenant du milieu usuel (IEBC, 1994) 
solide additionne d'erythromycine a la concentration finale de 25 ng/ml et incubes toute une nuit 
a 28°C. 

Les souches recombinantes de Bacillus thuringiensis exprimant le gene natif ou les genes 
mutes sont cultivees dans 250 ml de Milieu Usuel contenant de 25 p,g/ml d'erythromycine sous 
agitation a 28°C. La croissance des bacteries est verifiee par observation en microscopie optique 
a contraste de phase. Les bacteries sont cultivees jusqu'a la lyse bacterienne apres sporulation. La 
culture est alors centrifugee a 5000 g pendant 10 min. Le culot est lave avec 125 ml de NaCl 1M 
et la suspension est a nouveau centriftig^e a 5000g pendant 10 min. Le culot est alors repris dans 
15 ml d f eau distillee sterile contenant ImM de PMSF, incube dans la glace et traite aux ultra- 
sons (100W) pendant 1 min afin de dissocier les amas entre les spores et les cristaux. La 
suspension est ensuite deposee sur un gradient discontinu de NaBr compose d'une couche de 4 
ml de concentration 38,5%, de 4 couches de 6 ml de 41,9%, 45,3%, 48,9% et 52,7% et d'une 
couche de 3 ml dc 56,3%. Le gradient est alors centrifuge a 20000 g pendant 90 min a 20°C. Les 
differentes composantes de la suspension (spores, debris cellulaires, corps parasporaux) se 
positionnent dans le gradient a differents niveaux selon leur densite. Chaque bande est recuperee 
et lavee trois fois a l'aide d'un volume d'eau distillee sterile. Chaque bande est observee en 
microscopie optique a contraste de phase. La fraction contenant les corps d'inclusion est 
conservee a -20°C dans de 1'eau distillee sterile contenant 1 mM de PMSF pour analyse 
ulterieure. 

Exemple 7 : Analyse de la stabilite des proteines aux proteases 

La premiere analyse de stabilite realisee est la verification de la stabilite a la trypsine. Les 
proteines presentes dans le corps d'inclusion parasporal sont solubilisees pendant une heure a 
37°C dans Ic tampon de solubilisation (50 mM Na 2 C0 3 , pH 10,8, 14,6 mM 2-mercapthoethanol). 
La suspension est ensuite centrifugee a 14000 g pendant 10 min afin d'eliminer le materiel non 
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soluble. Le surnageant est alors additionne d'un dixieme du volume total de trypsine 0,05% et 
incube 2 h a 37°C. L'etat des proteines apres traitement a la trypsine est verifie par analyse en 
gels de polyacrylamide-SDS selon la methode de Laemmli (1970). Cette technique permet la 
separation des proteines selon leur masse moleculaire grace a la presence de SDS qui confere 
une charge globale negative a toutes les proteines. L'echantillon est d'abord traite en rajoutant un 
volume de solution de traitement 2X (125 mM Tris-HCl, 20% glycerol, 4% SDS, 10% 2- 
mercaptoethanol, 0,01 % bleu de bromophenol) puis est denature 5 min dans de l'eau bouillante. 
L'echantillon est ensuite depose sur le gel et traverse d'abord un premier gel de tassement 
compose d'un melange acrylamide-bisacrylamide 4%, 0,1% SDS, et de Tris-HCl 125mM, pH 
6,8. L'echantillon traverse ensuite le gel de separation compose d'acrylamide-bisacrylamide 12%, 
0,1% SDS, et de Tris-HCl 375mM, pH 8,8 et qui permet la separation des differentes proteines 
en fonction de leur taille. L'electrophorese est realisee a 100V dans du tampon de migration (25 
mM Tris-HCl, pH 8,3, 192 mM glycine, 0,1% SDS) jusqu'a ce que le bleu de bromophenol sorte 
du gel. Le gel est ensuite colore une heure a l'aide d'une solution de methanol 40%-acide 
ac&ique 7% contenant 0,025% de bleu de Coomassie puis decolore a l'aide d'une solution 
m&hanol 50%-acide acetique 10%. Le gel est definitivement fixe dans une solution de methanol 
5%-acide acetique 7%. 

La seconde analyse est la verification de la stabilite aux sues digestifs d'insectes. Les 
toxines stables a la trypsine sont purifiees par FPLC (Pharmacia) a l'aide d'une colonne 
echangeuse d'anions (Q-Sepharose) equilibree avec une solution de 40 mM de Na2C03, pH 
10,7. L'elution est realisee a l'aide d'un gradient de 50 a 500 mM de NaCl. La DO a 280 nm des 
fractions est mesuree et les fractions contenant les proteines sont analysees par electrophorese en 
gel de polyacrylamide-SDS. Les fractions contenant la toxine sont rassemblees et dialysees a 
4°C contre de l'eau distillee pendant environ 48h jusqu'a la precipitation des proteines. La 
suspension proteique est ensuite centrifugee a 8000 g et a 4°C pendant 30 min. Les toxines 
contenues dans le culot sont rcsuspendues dans de l'eau distillee puis dosees selon Bradford 
(1976). Elles sont ensuite reparties en fractions aliquotes de 100 |ag, lyophilisees puis stockees a 
4°C. Avant leur utilisation, les toxines sont solubilisees et placees a la concentration de 10 
mg/ml a l'aide de Tris 25mM, pi 1 9.5 en vue de tester leur stabilite aux sues digestifs de larves 
d'Ostrinia nubilalis. Le sue digestif des larves d'O. nubilalis peut etre preleve soil par 
regurgitation induite par un choc electrique selon la procedure de Ogiwara et al (1992), soit par 
dissection des larves et collecte du jus intestinal avec une pipette selon la methode decrite par 
Baines et ah (1994). Dans les deux cas entre 100 et 200 individus sont necessaires a la collecte 
du sue digestif. Le sue collecte est centrifuge a 15000 g pendant 15 minutes a 4°C avant 
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utilisation. La concentration en proteine du sue digestif est determinee par la methode de 
Bradford (BioRad). La reaction est conduite pendant 15 minutes a 37°C avec un rapport 1:1 
(base sur la concentration en proteine du sue digestif) de toxine et de sue digestif. La reaction est 
arretee avec un cocktail d'inhibiteurs de proteases (Protease Inhibitors Set, Roche Diagnostics) 
melangee avec un volume equivalent de solution de traitement 2X (125 mM Tris-HCl, 20% 
glycerol, 4% SDS, 10%, 2-mercaptoethanol, 0,01 % bleu de bromophenol), puis incubee 5 
minutes dans de Teau bouillante. Les proteines sont alors analysees par SDS-PAGE selon la 
procedure decrite ci-dessus pour determiner leur resistance aux sues digestifs des larves et leur 
etat de degradation eventuel. 

Le dernier type d'analyse de stabilite realise est celui de la stabilite a la pepsine. Les 
toxines natives et modifiees lyophilisees sont dissoutes dans un tampon gastrique (0,5 mg NaCl, 
1,75 ml HC1 1M dans 250 ml H2O, pH 2.0) simulant le fluide stomacal des mammiferes et 
contenant 0,32% de pepsine. Des echantillons sont retires apres 0, 5, 15, 60 et 240 minutes 
d'incubation a 37°C puis analyses par electrophorese en gels de polyacrylamide-SDS comme 
decrit ci-dessus. Ces conditions sont identiques celles decrites dans le rapport devaluation de 
PEPA (United States Environmental Protection Agency) n° 4458108. 

> 

Cette serie d'analyses permet de visualiser l'etat de conservation des proteines natives et 

i 

mutees, et done leur stabilite, a diverses proteases presentes chez les insectes (trypsine et sues 
digestifs) et par consequent de verifier que les proteines mutees ont effectivement conserve leur 
stabilite chez l'insecte. Ces analyses permettent egalement de verifier que les proteine mutees 
sont effectivement degradees par la pepsine dans les conditions similaires a celles presentes dans 
Testornac des mammiferes. 

Exemple 8 : Analyse des proprietes insecticides 

L'analyse de proprietes insecticides est realisee au travers de deux types 
d'experimentations permettant de tester les deux etapes du processus de toxicite chez l'insecte : 
la reconnaissance du site recepteur et I'e valuation de la toxicite in vivo. 

L'analyse de Faffinite des toxines pour le site recepteur est realisee a Taide de toxine 
radiomarquees a Tiode 125 ( l2 *I). Les toxines activees purifiees par FPLC et lyophilisees sont 
reprise dans du tampon de stockage (Tris-HCl 20 mM, pH 8.6) et analysees par SDS-PAGE 
pour verifier leur etat. Une fraction aliquote est dosee selon la methode de Bradford (1976). Les 
toxines sont iodinylees selon la methode de la chloramine-T (Markwell, 1982). 25 ^ig de toxine 
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sont incubes pendant 5 min a temperature ambiante avec 0.25 mCi de Na- I et une « Iodo- 
bead » (Pierce)_dans 50 ^1 de tampon sodium carbonate (50 mM Na2C03, pH 10). La reaction 
de iodinylation est ensuite deposee a la surface d'une colonne de dessalage au dextran (Pierce) 
equilibrees avec du tampon CBS (50 mM Na 2 C0 3 , pH 10,8, 150 mM NaCl) pour eliminer l'iode 
libre. Le marquage et la qualite de la proteine sont verifies par analyse par SDS-PAGE suivie 
d'une autoradiographic L'activite specifique moyenne d'une toxine marquee est de 100000 
cpm/pmol. 

Afin de preparer les vesicules de membrane de la bordure en brosse (BBMV) sur 
lesquels 1'etude de Taffinite des toxines pour les recepteurs est realisee, les insectes sont eleves 
jusqu'au dernier stade larvaire. L'insecte utilise est Ostrinia nubilalis, mais la methodologie mise 
en oeuvre est applicable a toute autre espece d'insecte. L'utilisation d'une autre espece d'insecte 
necessite d'adapter les conditions d'elevage et le milieu nutritif a chacune des especes 
envisagees, ce qui est facilement realisable par toute personne experte dans Tart. Les larves 
$ Ostrinia nubilalis sont elevees sur milieu nutritif artificiel meridic (Lewis et Lynch, 1969; 
Reed et al, 1972 ; Ostlie et al, 1984). La methode d'elevage des larves d! Ostrinia nubilalis est 
celle decrite par Huang et al (1997). Les larves sont Slevees individuellement dans des plateaux 
a 128 puits (Bio-Ba-128, C-D International). Chaque puits contient 2 ml de milieu artificiel. 
Apres dix jours les larves sont transferees dans des boites plus larges (18,4 cm de diametre et 
7,6 cm de hauteur) contenant 300 ml de milieu nutritif artificiel. Du carton ondule est place a 
1'interieur en guise de site de pupaison. Lors de la phase larvaire la temperature de la cellule 
d'elevage est de 25°C avec un eclairage constant (24 h). Les cartons contenant les chrysalides 
sont transferes dans des cages grillagees pour l'emergence et 1'elevage des adultes. Du papier 
cire est depose dans la cage pour recevoir les pontes. Les pontes sont prelevees et maintenant en 
attente a 15°C. L'elavage des adultes est conduit a 25°C avec 75% d'humidite relative et 14 h de 
photoperiode. 

Pour la conduite des tests d'afftnite des toxines pour les sites recepteurs, les larves sont 
collectees en debut de 5 dmc stade larvaire et mises a jeuner pendant 6 heures. Elles sont alors 
prelevees et deposees sur de la glace pendant 5 minutes. Les larves sont dissequees et le tube 
digestif et retire. Les tubes digestifs disseques sont groupes par 20, deposes dans un cryotube 
dontenant du tampon MET (300mM mannitol, 5mM EGTA, 1 7mM Tris-HCl, pH 7.5), congeles 
dans de Tazote liquide et conserves a -80C. 
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Les BBMV sont prepares selon la methode de precipitation differentielle au magnesium 
(Wolfersberger ei <//., 1987 ; Nielsen-LeRoux et Charles, 1992). Les BBMV sont repris dans du 
tampon TBS (20mM Tris-HCl, pH 8.5, 150mM NaCl) et la concentration totale en proteine est 
determinee par la methode de Bradford utilisant le kit Biorad et de la serumalbumine bovine 
(BSA) comme standard (Bradford, 1976). 

Les tests de reconnaissance de recepteurs in vitro sont realises dans des microtubes de 
L5 ml en polyethylene dans du tampon phosphate de sodium 20 mM pH 7.4 contenant 0.15 M 
de NaCl et 0.1% de serumalbumine bovine (PBS/BSA). Les tests sont realises, en double 
exemplaires, a temperature ambiante dans un volume total de 100 \xl 9 avec 10 ^ig de proteine de 
BBMV. Les toxine fixees sur les BBMV sont separees des toxines libres par centrifugation a 
14,000 x g pendant 10 min, a temperature ambiante. Les culots de chaque echantillon, contenant 
la toxine fixe sur la membrane, sont rinces deux fois avec 200 |il de tampon PBS/BSA (20 mM 
Tris/HCi, 150 mM NaCl, 0.1% BSA, pH 8.5) froid puis centrifuges. Les culots sont finalement 
resuspendus dans 200 \xl de tampon PBS/BSA et ajoutes a 3 ml de cocktail scintillant HiSafe 3 
(Pharmacia) dans une fiole a scintillation. Le comptage est realise dans un compteur a 
scintillation liquide. 

Les tests de fixation directe sont conduit selon le protocole de Nielsen-LeRoux et Charles 
(1992). 30 ng de BBMV par microtube sont incubes avec une serie de concentrations de 1 a 100 
mM de toxine marquee a I'iode 125 I dans du tampon Tris / BSA buffer (20 mM Tris/HCl, 150 mM 
NaCl, 0.1% BSA, pH 8.5). Le taux d'accrochage non specifique est determine dans des experiences 
paralleles en presence d'un exces de 300 fois de toxine non marquee. Apres 90 minutes d'incubation 
a temperature ambiante les echantillons sont centrifuges a 14000 g pendant 10 minutes a 4°C. Les 
culots sont rinces deux fois avec du tampon Tris/BSA froid et ressuspendus dans 150 \il du meme 
tampon et ajoutes a 3 ml de cocktail scintillant HiSafe 3 (Pharmacia) dans une fiole a scintillation. 
Chaque experience est realisee en double et chaque point experimental est compte deux fois dans un 
compteur a scintillation liquide. Les donnes sont analysees a l'aide du logiciel LIGAND (Munson 
and Rodbard. 1980) commercialise par la Societe Biosoft. 

Les experiences de competition homologue sont realisees comme decrit precedemment 
pour les experiences d'accrochage direct avec 10 \±g de BBMV dans un volume total de 100 jil 
pendant 90 min a temperature ambiante. Les BBMV sont incubes dans une concentration fixe de 
10 nM de toxine marquee a I'iode I en presence d'une serie de concentrations (de 0.1 a 300 
fois la concentration de la toxine marquee) dans du tampon Tris/BSA. La valeur de 1'accrochage 
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non specifique (1'accrochage toujours present en presence d'un exces de 300 fois de la toxine 
non marquee) est soustrait de la valeur totale comptee. Chaque experience est realisee en double 
et chaque point experimental est compte deux fois dans un compteur a scintillation liquide. Les 
donnees sont analysees a Taide du logiciel LIGAND (Munson and Rodbard, 1980) 
commercialise par la Societe Biosoft. 

Les tests de toxicite in vivo sont realises selon la procedure decrite par Lambert et al 
(1996). La toxine activee et solubilisee est incorporee dans le milieu nutritif a diverses 
concentrations encadrant la dose letale 50% (DL 50 ) de Cry9Cal pour Ostrinia nubilalis qui est 
de 96,6 ng de toxine par cm 2 de surface de milieu. Six doses de 0,1 ng/cm 2 , 1 ng/cm 2 , 
10 ng/cm 2 , 100 ng/cm 2 , 1000 ng/cm 2 et 10000 ng/cm 2 sont utilisees pour ^valuer la DL 50 des 
toxines natives et modifiees. Les tests de toxicite sont realises sur des larves neonates dans des 
plaques de 24 puits de 2 cm 2 (MultiwelI-24 plates, Corning Costar Corp.). 50 \\\ de chacune des 
dilutions de toxine sont etales sur le milieu et seches sous une hotte a flux. Une larve est 
deposee dans chaque puis et un total de 24 larves est utilise pour chaque dose (une plaque par 
dose). Pour chaque dose le test est repete au moins trois fois. Un controle est realise avec de 
l'eau distillee. Les plaques sont couvertes et deposees a 25°C, 70% d'humidite relative et avec un 
photoperiode 16 h. La> mortalite est controlee apres 7 jours est la DL 50 est calculee selon la 
methode des probits (Finney, 1971). 
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Revendications 

1- Proteine Cry modifiee sensible a la pepsine, caracterisee en ce qu'elle possede au moins 
un site de coupure par la pepsine additionnel 

2- Proteine Cry modifiee selon la revendication K caracterisee en ce que le site de coupure 
par la pepsine additionnel est represents par un residu acide amine choisi parmi les residus 
leucine, phenylalanine ou acide glutamique 

3- Proteine Cry modifiee selon Tune des revendications 1 ou 2, caracterisee en ce qu'elle 
est selectionnee parmi les proteines Cryl, Cry3, Cry4 ? Cry 7, Cry 8, Cry9, Cry 10, Cry 16, Cry 17, 
Cry 19, ou Cry 20 

4- Proteine Cry modifiee selon la revendication 3, caracterisee en ce qu'elle est une 
proteine Cry9C 

5- Proteine Cry modifiee selon la revendication 4, caracterisee en ce qu'elle est la proteine 
Cry9Cal 

6- Proteine Cry modifiee selon Tune des revendications 1 a 5, caracterisee en ce qu'elle 
possede au moins un site de coupure par la pepsine additionnel dans au moins une des boucles 
inter-helices alpha du domaine I 

7- Proteine Cry modifiee selon Tune des revendications 1 a 6, caracterisee en ce qu'elle 
possede au moins un site de coupure par la pepsine additionnel dans la boucle inter-helices alpha 
reliant les helices alpha 3 et 4 du domaine I 

8- Proteine Cry modifiee selon Tune des revendications 5 a 7 ; caracterisee en ce qu'elle 
possede un site de coupure par la pepsine additionnel en position 164 

9- Proteine Cry modifiee selon la revendication 8, caracterisee en ce qu'elle est 
selectionnee parmi les proteines Cry dont les sequences sont representees par les identificateurs 
SEQ ID NO:4, SEQ ID NO:6 ou SEQ ID NO:8 
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10- Proteine Cry modifiee selon I'une des revendications 1 a 5 ? caracterisee en ce que les 
sites de coupure par la pepsine additionnels sont introduits par substitution de residus acide 
aspartique par des residus acide glutamique, substitution de residus tryptophane par des residus 
phenylalanine, et substitution de residus valine ou isoleucine par des residus leucine 

11- Proteine Cry modifiee selon la revendication IK caracterisee en ce que le taux de 
substitutions que possede ladite proteine Cry est de 25 % 

12- Procede d'augmentation de la sensibilite a la pepsine des proteines Cry, caracterise en 
ce que Ton introduit au moins un site de coupure par la pepsine additionnel dans lesdites 
proteines Cry 

13- Procede selon la revendication 12, caracterise en ce que le site de coupure par la 
pepsine additionnel introduit est represents par un residu acide amine choisi parmi les residus 
leucine, phenylalanine ou acide glutamique 

14- Procede selon Tune des revendications 12 ou 13, caracterise en ce qu'il s'applique aux 
proteines Cry selectionnees parmi les proteines Cryl, Cry3, Cry4, Cry7, Cry 8, Cry9, Cry 10, 
Cryl6, Cry 17, Cryl9, ou Cry20 

■ 

15- Procede selon la revendication 14, caracterise en ce qu'il s'applique a la proteine Cry9C 

16- Procede selon la revendication 15, caracterise en ce qu f il s'applique a la proteine 
Cry9Cal 

17- Procede selon Tune des revendications 12 a 16, caracterise en ce qu'au moins un site de 
coupure par la pepsine additionnel est introduit dans au moins une des boucles inter-helices 
alpha du domaine I desdites proteines Cry 

18- Procede selon Tune des revendications 12 a 17, caracterise en ce qu'au moins un site de 
coupure par la pepsine additionnel est introduit dans la boucle inter-helices alpha reliant les 
helices alpha 3 et 4 du domaine I 

19- Procede selon Tune des revendications 16 a 18, caracterise en ce qu'un site de coupure 
par la pepsine additionnel est introduit en position 164 
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10- Proteine Cry modifiee selon l'une des revendications 1 a 5, caracterisee en ce que 
les sites de coupure par la pepsine additionnets sont introduits par substitution de residus 
acide aspartique par des residus acide glutamique, substitution de residus tryptophane par des 
residus phenylalanine, et substitution de residus valine ou isoleucine par des residus leucine 

1 1- Proteine Cry modifiee selon la revendication 10, caracterisee en ce que le taux de 
substitutions que possede ladite proteine Cry est de 25 % 

12- Procede d'augmentation de la sensibilite a la pepsine des proteines Cry, caracterise 
en ce que Ton introduit au moins un site de coupure par la pepsine additionnel dans lesdites 
proteines Cry 

13- Procede selon la revendication 12, caracterise en ce que le site de coupure par la 
pepsine additionnel introduit est represents par un residu acide amine choisi parmi les residus 
leucine, phenylalanine ou acide glutamique 

14- Procede selon Tune des revendications 12 ou 13, caracterise en ce qu'il s'applique 
aux proteines Cry selectionnees parmi les proteines Cryl, Cry3, Cry4, Cry 7, Cry 8, Cry9, 
Cry 10, Cry 16, Cry 17, Cry 19, ou Cry20 

15- Procede selon la revendication 14, caracterise en ce qu'il s'applique a la proteine 
Cry9C 

16- Procede selon la revendication 15, caracterise en ce qu'il s'applique a la proteine 
Cry9Cal 

1 7- Procede selon Tune des revendications 12 a 16, caracterise en ce qu'au moins un site 
de coupure par la pepsine additionnel est introduit dans au moins une des boucles inter-helices 
alpha du domaine I desdites proteines Cry 

18- Procede selon Tune des revendications 12 a 17 ? caracterise en ce qu'au moins un site 
de coupure par la pepsine additionnel est introduit dans la boucle inter-helices alpha reliant les 
helices alpha 3 et 4 du domaine I 
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20- Procide seion Tune dcs revendications 12 a 16, caracterise en ce que les sites de 
coupure par la pepsine additionnels sont introduits par substitution de residus acide aspartique 
par des residus acide glutamique, substitution de residus tryptophane par des residus 
phenylalanine, et substitution de residus valine ou isoleucine par des residus leucine 

21- Procede selon la revendication 20, caracterise en ce que le taux de substitution que 
possede ladite proteine Cry est inferieur ou egal a 25 % 

22- Polynucleotide codant une proteine Cry modifiee selon Tune des revendications 1 a 1 1 

23- Gene chimere comprenant au moins, lies entre eux de maniere operationnelle: 

(a) un promoteur fonctionnel dans un organisme hote 

(b) un polynucleotide selon la revendication 22 

(c) un element terminateur fonctionnel dans un organisme hote 

■ 

24- Gene chimere selon la revendication 23, caracterise en ce que le promoteur et l'element 
terminateur sont fonctionnels dans les plantes 

25- Vecteur d'expression ou de transformation contenant un gene chimere selon Tune des 
revendications 23 ou 24 

26- Vecteur selon la revendication 27, caracterise en ce qu'il est un plasmide, un phage ou 
un virus 

27- Organisme hote transforme avec Tun des vecteurs selon Tune des revendications 25 ou 

26 

28- Organisme hote selon la revendication 27, caracterise en ce qu'il est une plante 

29- Plante selon la revendication 28, caracterisee en cc qu'elle contient, en plus d'un gene 
chimere scion Tune des revendications 23 ou 24, au moins un autre gene chimere contenant un 
polynucleotide codant pour une proteine d'interct 

30- Partie d'une plante selon la revendication 29 
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19- Precede selon Tune des revendications 16 a 18, caracterise en ce qu'un site de 
coupure par la pepsine additionnel est introduit en position 164 

20- Procede selon Tune des revendications 12 a 16, caracterise en ce que les sites de 
coupure par la pepsine additionnels sont introduits par substitution de residus acide aspartique 
par des residus acide glutamique, substitution de residus tryptophane par des residus 
phenylalanine, et substitution de residus valine ou isoleucine par des residus leucine 

21- Procede selon la revendication 20, caracterise en ce que le taux de substitution que 
possede ladite proteine Cry est inferieur ou egal a 25 % 

22- Polynucleotide codant une proteine Cry modifiee selon Tune des revendications 1 a 

11 

23- Gene chimere comprenant au moins, lies entre eux de maniere operationnelle: 

(a) un promoteur fonctionnel dans un organisme hote 

(b) un polynucleotide selon la revendication 22 

(c) un element terminateur fonctionnel dans un organisme hote 

24- Gene chimere selon la revendication 23, caracterise en ce que le promoteur et 
l'element terminateur sont fonctionnels dans les plantes 

25- Vecteur depression ou de transformation contenant un gene chimere selon Tune 
des revendications 23 ou 24 

26- Vecteur selon la revendication 25, caracterise en ce qu'il est un plasmide, un phage 
ou un virus 

27- Organisme hote transforme avec Tun des vecteurs selon Tune des revendications 25 

ou 26 

28- Organisme hote selon la revendication 27, caracterise en ce qu'il est une plante 
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31- Graines d'une plantc selon la revendication 29 

32- Procede de production des proteines Cry modifiees selon Tun des revendications 1 a 
1 1 , caracterise en ce qu'il cornprend au moins les etapes de: 

(a) mise en culture d'un organisme bote transforme selon l'invention dans un milieu de 
culture adapte a la croissance et a la multiplication dudit organisme 

(b) extraction des proteines Cry produites par 1'organisme transforme cultive a i'etape (a) 

33- Procede selon la revendication 32, carcaterise en ce qu'il cornprend une etape (c) de 
purification des proteines Cry extraites a 1'etape (b) 

34- Procede selon Tune des revendications 32 ou 33, caracterisee en ce que 1'organisme 
hote est un microorganisme 

35- Procede selon la revendication 34, caracterisee en ce que 1'organisme hote est une 
bacterie Bacillus thuringiensis 

r 

36- Anticorps monoclonaux ou polyclonaux, caracterises en ce qu'ils sont diriges contre 
une proteine Cry modifiee selon Tune des revendications 1 a 1 1 
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29- Plante selon la revendication 28, caracterisee en ce qu'clle contient, en plus d'un 
gene chimere selon Tune des revendications 23 ou 24, au moins un autre gene chimere 
contenant un polynucleotide codant pour une proteine d'interet 

30- Partie d'une plante selon la revendication 29 

31- Graines d'une plante selon la revendication 29 

32- Procede de production des proteines Cry modifiees selon Tun des revendications 1 a 
1 1, caracterise en ce qu'il comprend au moins les etapes de: 

(a) mise en culture d'un organisme hote transforme selon la revendication 27 dans un 
milieu de culture adapte a la croissance et a la multiplication dudit organisme 

(b) extraction des proteines Cry produites par Torganisme transforme cultive a Petape 

(a) 

33- Procede selon la revendication 32, carcaterise en ce qu'il comprend une etape (c) de 
purification des proteines Cry extraites a l'etape (b) 

34- Procede selon l'une des revendications 32 ou 33, caracterisee en ce que Torganisme 
hote est un microorganisme 

35- Procede scion la revendication 34, caracterisee en ce que 1'organisme hote est une 
bacterie Bacillus thuringiensis 

36- Anticorps monoclonaux ou polyclonaux, caracterises en ce qu'ils sont diriges contre 
une proteine Cry modifiee selon Tune des revendications 1 a 1 1 
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atgaatcgaa ataatcaaaa tgaatatgaa attattgaag ccccccattg 
tgggtgtcca tcagaagaag aattaaggta tcctttggca agtgaaccaa 
atgcagcgtt acaaaatatg aactataaag aatacttaca aatgacagaa 

■ 

gaggaataca ctgaatctta tataaatcct agtttatcta ttagtggtag 
agaagcatta cagactgcgc ttactgttat taggagaata ctcggggctt 
taggtttacc gttttctgga caaatattaa gtttttatca attcctttta 
aatacactgt ttccattaaa tgaaacagct atatttgaag ctttcatgcg 
acagttagag gaacttttaa atcaacaaat aacagaattt gcaagaaatc 
aggcacttgc aagattgcaa ggattaggag aatcttttaa tttatatcaa 
cgttcccttc aaaatttttt ggctgaacga aatgaaacac gaaatttaag 
tttattacgt gctcaattta tagctttaga acttgaattt ttaaatgcta 
ttccattgtt tgcattaaat ggacagcagt taccattact gtcattatat 
gcacaagctt taaatttaca tttgttatta ttaaaagaag catctctttt 
tggagaagga tttggattca cacaggggga aatttccaca tattatgaac 
gtcaattgga • actaaccgcit. aagtacacta attactgtga aactttttat 
aatacaggtt tagaacgtt : t aagaggaaca aatactgaaa gtttfcttaag 
atatcatcaa ttccgtagaig aaatgacttt attattatta gaattattag 
cgctatttcc atattatgaa ttacgacttt atccaacggg atcaaaccca 
cagcttacac gtgagttata tacagaaccg attttattta atccaccagc 
taarttagga ctttgccgac gttttggtac taatccctat aatacttttt 
cLqagctcga aaatgcctt.c attcgcccac cacatctttt tgaaaggctg 
aatagcttaa caatcagca-g taatcgattt ccattatcat ctaattttat 
ggaatatttt tcaggacata cgttacgccg tagttatctg aacgaatcag 
cattacaaga agaaagttat ggcctaatta caaccacaag agcaacaatt 
aatcccggat tagaacgaac aaaccgcata gagtcaacgg cattagaatt 



FIG 1 
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'.cgttctgca 
caggaggct t 
gaacccLatg 
ttcaacccat 
acgctgga tc 
cgtcgtgaat 
attaccattg 
aaggtccagg 
acat t tggaa 
tcgcctaaga 
tccgtggagg 
agagggcagg 
tactggtccg 
taacattaaa 
agaat tgaaa 
agaagcggcg 



t tga Laggta 
gt t taatggt 
aaacaaatga 
agaclatc:.c 
tatagctaat 
tagaact La a 
ttaaacgcat 
att Lacagga 
cgttaagatt 
ttacgtt t tg 
gfctatctatc 
aactaactta 
ttcaa tccgc 
tgcagaaggt 
ttttaccttt 
aagaaagcg 



t a t a tggctt 
acgact tctc 
agaaLUcca 
ar. ttaacctt 
gcaqgaagt t 
taatacgatt 
ctgcacct tt 
gggggtatac 
aacgttaaat 
cctcaacagg 
ggtgaafctaa 
cgaatccttt 
cttttacat t 
ttaagcaccg 
aaatccggca 



aaa tagagct 
ctgctaa tgg 
ccagaagaaa 
tt ttagct 1 1 
tacctac: ta 
accccaaata 
atcgggtact 
tccgaagaac 
tcaccattaa 
aaatttcagt 
gattagggag 
ttcacaagag 
tacacaagct 
gtggtgaata 
cgagaagcgg 



ncti t ttac 
agga tg taga 
gt accqcaag 
caaactaa *. c 
tttatttacc 
gaa :tacaca 
acgttat t aa 
aactaa tggc 
cacaacaa ta 
ataaggttac 
cacaa tgaac 
agtt tactac 
caagagat t c 
ttata tagaa 
aagaggaat t 
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MNRNNQNEYE IMAPHCGCP SEEELRYPLA SEPNAALQNM NYKEYLQMTE 
EEYTESY INP SLSISGREAL QTAL7LLGRI LGALGLPFSG QILSFYQFLL 
NTLFPLNETA TFEAFMRQLE ELLNQQITE? ARNQALARLQ GLGESFNLYQ 
RSLQNFLAER NETRN LSLLR AQFIALELEF LNAIPLFALN GQQLPLLSLY 
AQALNLHL1-L LKEASI-FGEG FGF7QGEIST YYERQLELTA KYTNYCETFY 
NTGLERLRGT NTESFLRYHQ FRREMTLLLL ELLALFPYYE LRLYPTGSNP 
QLTRELYTEP ILFNPPANLG LCRRFGTNPY NTFSELENAF IRPPHLFERL 
NSLTISSNRF PLSSNFMEYF SGHTLRRSYL NESALQEESY GLITTTRATI 
NPGLEGTNRI ESTAJLEFRSA LIGIYGLNRA SFLPGGLFNG TTS PANGGCR 
ELYETNEELP PEESTGSSTfi RLSHLTFFSF QTNQAGSIAN AGSLPTYLFT 
RREUELNNTI TPNRITQLPL LKASAPLSGT TLLKGPGFTG GGILRRTTNG 
TFGTLRLTLN SPLTQQYRLR LRFASTGNFS IRIiLRGGLSI GELRLGSTMN 
RGQELTYESF FTREFTTTGP FNPPFTFTQA QEILTLNAEG LSTGGEYYIE 
RIEILPLNPA REAEEELEAA KKA 

FIG 2 
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Oi igonucieo: ide 


n 


°53 : 


: tgaatatgaaat tattgaagccccccattg 


Oi igonucleot iae 


n 




: tgggtgtccatcagaagaagaattaaggtatcct ttggca 


OI igonucleot ide 


n 


^ l» c 


: recti tggcaag tgaaccaaatgcagc 


OI igonuciecr. ide 


n 


°56 


: gaactataaagaatact tacaaa tg 


Oligonucleotide 


r. 


°^7 


: caaatgacagaagaggaatacactga 


OI igonucleot ide 


n 


c 58 : 


: tacactgaatct tat ataaa 


OI igonucleot ide 


n 


°59 : 


: ta t tagtggtagagaagcattacagactgcgcttac 


OI. igonucleot ide 


n 


°60 


: cagactgcgcttactgt tat taggagaa tact eggg 


Oligonucleotide 


n 


°61 : 


: gggct t taggtttaccgt t ttctgg 


OI igonucleot ide 


n 


°62 


: ttctggacaaatattaagt ttt tatcaa 


OI igonucleot ide 


n 


°63 : 


: cttttaaatacactgtttccattaaatgaaacagctatat 


Oligonucleotide 


n 


°64 : 


; acagctatatttgaagct ttcatg 


Oligonucleotide 


n 


°65 ; 


: ctt tcatgcgacagttagaggaactt 


Oligonucleotide 


n 


06 


; gaggaacttttaaatcaacaaataac 


Oligonucleotide 


n 


°67 : 


: ggattaggagaatcttttaat 


OI igonucleot ide 


n 


°68 : 


tcttttaat ttatatcaacgttc 


OI igonucleot ide 


n 


°69 : 


; cct tcaaaat tttttggctga 


Oligonucleotide 


n 


°7C : 


t tggctgaacgaaatga 


01 igonucleot ide 


n 


°71 : 


cgaaatgaaacacgaaatttaag 


01 igonuc i eot ide 




°12 : 


acacgaaatt taagt ttattacgtgctcaat t ta tag 


01 igonucleot ide 


n 


°73 : 


gctcaat t tatagctttagaact tgaatt t ttaaa tgcta t tec at tg 


01 igonucleot ide 


n 


°74 : 


ccat tgtttgcattaaatggacagcag 


Oligonucleotide 


n 


/ D : 


aat ggacagcagttaccat tact g tea 


Olioonucleot i de 


n 


°76 : 


cca t tact gtcatt a tatgeacaaget 


Ci igonuci ectice 


n 


°~7 : 


tatgeacaaget ttaaa tt tacatt t 


O } i a on uc 1 eo ~ i ci 0 


n 


-• ;\ ; 


ttatiaaaagaagcatctct.ti *c 


J] • gcnuclect ide 


r. 




t gqaga age at ttgga t:ca cacao 


0 1 i q on uc". e z i d e 






3 ca t a t z a t gaacg t caa 1 z gg a 



FIG 3 
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Oligonucleotide 


n°81 : 


tactgtgaaactttttataatacaggtt 


Oligonucleotide 


n°82 : 


tacaggtttagaacgtttaagagga 


Oligonucleotide 


n°83 : 


aatactgaaagtt ttttaagatatcatc 


Oligonucleotide 


n°84 : 


gtagagaaatgactttattafctattagaattattagcgctatttccatatt 


Oligonucleotide 


n°85 : 


tt tccatattatgaattacgactttatccaac 


Oligonucleotide 


n°86 : 


cttacacgtgagttatatacaga 


Oligonucleotide 


n°87 : 


tatacagaaccgattttatttaatccacc 


Oligonucleotide 


n°88 : 


ccaccagctaatttaggactttgccgac 


Oligonucleotide 


n°89 : 


ctttgccgacgttttggtactaatccc 


Oligonucleotide 


n°90 : 


catctttttgaaaggctgaatag 


Oligonucleotide 


n°91 : 


taatcgatttccattatcatctaattttat 


Oligonucleotide 


n°92 : 


ctaattttatggaatatttttcaggacatacgttac 


Oligonucleotide 


n°h : 


tagttatctgaacgaatcagcattacaagaaga 


Oligonucleotide 


n°94 : 

f ■ • 


caagaagaaagttatggcct 


Oligonucleotide 


n°95 : 


caattaatcccggattagaaggaacaaaccgcata 


Oligonucleotide 


n°96 : 

» 


gagtcaacggcattagaatttcgttctgca 


Oligonucleotide 


n°97 ; 


ggtatatatggcttaaatagagct tc 


Oligonucleotide 


n°9,8 : 


tagagcttcttttttaccaggaggcttgtt 


Oligonucleot ide 


n°9.9 : 


ctgctaatggaggatgtagagaactctatga 


Oligonucleotide 

— * 


n°100 


: ctctatgaaacaaatga 


Oligonucleotide 


n° 101 


: acaaatgaagaattaccacc 


Oligonucleotide 


n° 102 


: at taccaccagaagaaagtaccggaag 


Oligonucleotide 


n°103: 


agactatctcat ttaaccttttt t agcttt 


Oligonucleotide 


n i u 4 


: g c l aa Lgca gga ag t_ cc a ccl a ct l a l 


Oligonucleot ide 


n°105 


: cctacttatttatttacccgtcgtga 


Oligonucleotide 


n°106 


: acccgtcgtgaattagaact t aa taat acgatt 


Oligonucleot ide 


n°107 


: at t accattgttaaaggcat ctgc 


Oligonucleot ide 


n° 108 


: aaggcatctgcacct ttat cgggtactacg 



FIG 3 (suite) 
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01 igonucleotioe 


n° 


109 


: tcgggtactacgttattaaaaggtccagg 


Oligonucleotide 


n° 


110 


: acatttggaacgttaagattaacgttaaatt caeca tta 


Oligonucleot ide 


n° 


111 


: cacaacaatatcgcctaagattacgttttgcctcaac 


Oligonucleotide 


n° 


112 


: aaa t ttcagtataaggttactccgtqgaggg 


01 igonucleot ide 


n° 


113 


: ctccgtggagggttatctatcggtga 


Oligonucleotide 


n° 


114 : 


: tctatcggtgaattaagattagggagcac 


Oligonucleotide 


n° 


115 : 




Oligonucleot ide 


n° 


116 : 


: aatgcagaaggtttaagcaccggtggtgaata 


Oligonucleotide 


n° 


117 : 


gtggtgaatattatatagaaagaattgaaatt 


Oligonucleotide 


n°118 : 


agaattgaaattttacctttaaatccggcacgagaag 


Oligonucleotide 


n° 


119 : 


cgagaagcggaagaggaattagaagcggcg 



FIG 3 (suite) 
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atgaatcgaa afeaatcaaaa tgaatatgaa attattgatg ccccccattg 
tgggtgtcca tcagatgacg atgtgaggta tcctttggca agtgacccaa 
atgcagcgtt acaaaatatg aactataaag attacttaca aatgacagat 
gaggactaca ctgattctta tataaatcct agtttatcta ttagtggtag 
agatgcagtt cagactgcgc ttactgttat taggagaata ctcggggctt 
taggtgttcc gttttctgga caaatattaa gtttttatca attcctttta 
aatacactgt ggccagttaa tgatacagct atatgggaag ctttcatgcg 
acaggtggag gaacttgtca atcaacaaat aacagaattt gcaagaaatc 
aggcacttgc aagattgcaa ggattaggag aatcttttaa tgtatatcaa 
cgttcccttc aaaattggtt ggctgatcga aatgatacac gaaatttaag 
tttattacgt gctcaattta tagctttaga ccttgatttt gttaatgcta 
ttccattgtt tgcagtaaat tggacagcagg ttccattact gtcagtatat 
gcacaagctt taaatttaca.tttgttatta ttaaaagaag catctctttt 
tggagaagga tggggattca cacaggggga aatttccaca tattatgaac 
gtcaattgga actaaccgct aagtacacta attactgtga aacttggtat 
aatacaggtt tagaacgttt aagaggaaca aatactgaaa gttttttaag 
atatcatcaa ttccgtagag aaatgacttt agtggtatta gatgttgtgg 
cgctatttcc atattatgat ^gtacgacttt atccaacggg atcaaaccca 
cagcttacac gtgaggtata tacagatccg attgtattta atccaccagc 
taatttagga ctttgccgac .gttggggtac taatccctat aatacttttt 
ctgagctcga aaatgccttc attcgcccac cacatctttt tgaaaggctg 
aatagcttaa caatcagcag taatcgattt ccagtttcat ctaattttat 
ggaatatttt tcaggacata cgttacgccg tagttatctg aacgattcag 
cagtacaaga agatagttat ggcctaatta caaccacaag agcaacaatt 
aatcccggag ttgatggaac aaaccgcata gagtcaacgg cattagaatt 
tcgrtctgca ttgataggta tatatggctt aaatagagct tcttrtgtcc 
cagga.jgctt gtttaatggt acgacttctc ctgctaatgg aggatigtaga 
gatctctatg atacaaatga tqaattacca ccagatgaaa gtaccggaag 



FIG 4 
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1 *: c a 3 c c cat 
agqctgqatc 
cgtcgtqa t g 
attacca tt g 
aaggtccacg 
acatt tggaa 
'xqcctaaga 
t ccgtggagg 
agagggcagg 
tactggtccg 
taacagtgaa 
agaa t tgaaa 
agaagcggcg 



agacta-:ctc 
ta tagctaat 
tggaccttaa 
gtaaaggcat 
a *; ttacagqa 
cgttaagagr. 
ttacgttttg 
ggt ttctatc 
aactaactta 
t tcaatccgc 
tgcagaaggt 
t tgtccctgt 
aagaaagcg 



aittaacctt 
qcaggaagtg 
taatacgatt 
ctgcacctgt 
gggggtatac 
aacggt taat 
cctcaacagg 
ggtga tgtta 
cgaat ccttt 
ct tt tacatt 
gttagcaccg 
gaatccggca 



8/9 

ttttagcttt 
tacctact ta 
accccaaata 
ttcgggtacr. 
tccgaagaac 
tcaccat:aa 
aaa tttcagt 
gat tagggag 
ttcacaagag 
tacacaagct 
gtggtgaata 
cgagaagcgg 



caaa»;taa Lc 
tgtttggacc 
gaaLtaca ca 
acggt ci. taa 
aactaatgqc 
ca'Zaacaaza 
at aagggt ac 
cacaa tgaac 
agt 1 1 actac 
caagagat tc 
t ta tatagat 
aagaggat tt 



FIG 4 (suite) 



1er depot 

9/9 

MNRNNQNEYE IIDAPHCGCP SDDDVRYPLA SDPNAALQNM NYKDYLQMTD 
EDYTDSYINP SLSISGRDAV QTALTKLGRI LGALGVPFSG QILSFYQFLL 
NTLWPVNDTA IWEAFMRQVE ELVNQQITEF ARNQALARLQ GLGESFNVYQ 
RSLQNWLADR NDTRNLSLLR AQFIALDLDF VNAIPLFAVN GQQVPLLSVY 
AQALNLHLLL LKEASLFGEG WGFTQGEIST YYERQLELTA KYTNYCETWY 
NTGLERLRGT NTESFLRYHQ FRREMTLVVL DVVALFPYYD VRLYPTGSNP 
QLTREVYTDP IVFNPPANLG LCRRWGTNPY NTFSELENAF IRPPHLFERL 
NSLTISSNRF PVSSNFMEYF SGHTLRRSYL NDSAVQEDSY GLITTTRATI 
NPGVDGTNRI ESTALEFRSA LIGIYGLNRA SFVPGGLFNG TTSPANGGCR 
DLYDTNDELP PDESTGSSTH RLSHLTFFSF QTNQAGSIAN AGSVPTYVWT 
RRDVDLNNTI TPNRITQLPL VKASAPVSGT TVLKGPGFTG GGILRRTTNG 
TFGTLRVTVN SPLTQQYRLR LRFASTGNFS IRVLRGGVSI GDVRLGSTMN 
RGQELTYESF FTREFTTTGP FNPPFTFTQA QEILTVNAEG VSTGGEYYID 
RIEIVPVNPA REAEEDLEAA KKA 

FIG 5 
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LISTE DE SEQUENCES 

< 1 10> Aventis CcopScience SA 

<120> Toxine insecticide de Bacillus thuringiensis modifiee 
sensible a la pepsine 

<130> PRO 01002 

<14 0> 
< 1 '1 1 > 

<160> 160 

<170> Patentln Ver. 2.1 

<210> 1 
<211> 2019 
<212> ADN 

<213> Bacillus thuringiensis 

<220> 

<221> CDS 

<222> (1) . . (2019) 

* 

<400> 1 

atg aat cga aat aat caa aat gaa tat gaa att att gat gcc ccc cat 48 
Met Asn Arg Asn Asn Gin Asn Glu Tyr Glu He He Asp Ala Pro His 
1 5 10 .15 

tgt ggg tgt cca tea gat gac gat gtg agg tat cct ttg gca agt gac 96 
Cys Gly Cys Pro Ser Asp Asp Asp Val Arg Tyr Pro Leu Ala Ser Asp 

20 25 30 

cca aat gca gcg tta caa aat atg aac tat aaa gat tac tta caa atg 144 
Pro Asn Ala Ala Leu Gin Asn Met Asn Tyr Lys Asp Tyr Leu Gin Met 
35 4 0 4 5 

aca gat gag gac tac act gat tct tat ata aat cct agt tta tct att 192 
Thr Asp Glu Asp Tyr Thr Asp Ser Tyr He Asn Pro Ser Leu Ser He 
50 55 60 

agt ggt aga gat gca gtt cag act gcg ctt act gtt gtt ggg .aga ata 240 
Ser Gly Arg Asp Ala Val Gin Thr Ala Leu Thr Val Val Gly Arg He 
65 ™ 75 80 

etc ggg get tta ggt gtt ccg ttt tct gga caa ata gtg agt ttt tat 238 
Leu Gly Ala Leu Gly Val Pro Phe Ser Gly Gin He Val Ser Phe Tyr 

8 5 90 95 



caa ttc ctt tta aat aca ctg tgg cca gtt aat gat aca get ata tgg 
Glr. Pr.e Leu Leu Asn Thr Leu Tro Pro Val Asn Asp Thr Ala He T^p 

100 105 HO 



Glu Ai* Phe Met Arg Gin Val Glu Glu Leu Val Asn Gin 



ttc atg cga cag gtg gao gaa ctt gtc 



n lie Thr 



~ I 'D •> ? n 



125 



336 



aat caa caa ata aca 384 



j w: ..u_ gca aga aat cag gca ctt gca aga ttg caa gga tta qaa gac 4^2 
G- u Phe Ala Arg Asn Gin Ala Leu Ala Arg Leu Gin Gly Leu Gly Asp 

135 14Q 



— ... ler depot 

2 

, • i • < j i 



*;••:*: -.r.t aat. 

3e:: Phe Asn 

: n f > 

aat aca 

Asn Asp Thr 



g a c r t 'c g a i: 
A:;p Lot: Asp 



c a a a t 1 c c a 

Glii Val Pro 
195 

tta tta tta 

Leu Leu Leu 
210 

cag ggg gaa 

Q\r\ Gly Glu 

aag tac act 

Lys Tyr Thr 



tta aga gga 
Leu Arg Gly 



aga gaa atg 

Arg Glu Met 
275 

tat gat gta 

Tyr Asp Val 
290 

gsg gta tat 

Glu Val Tyr 
3C 5 

;L*. tqc eg a 

Leu Cvs Ara 



^ o a cs a t g c c 
G : Asr. A.1 a 




t -;ea 



gta tat caa 
Val~Tyr Gin 
1 5 0 

cga aat tta 
Arq Asn Leu 
165 

1 1 g 1 1 a a t 

Phe Val Asn 
ISO 

tta ctg tea 

Leu Leu 3er 

aaa gat gca 
Lys Asp Ala 



att tec aca 
He Ser Thr 
230 

aat tac tgt 
Asn Tyr Cys 
245 

aca aat act 
Thr Asn Thr 
260 

act tta gtg 
Thr Leu Val 



cga ctt tat 
Arg Leu Tyr 



aca gat ccg 

Thr Asp) Pro 
310 

cgt tgg qgt 

Arg Trp Gly 
325 

ttc att cgc 

Phe lie Arg 

age: a g z a a t 

Ser Ser Asn 

»_« O ^ C- ^ . 

o 1 y : i r. r 



cgt tec ctt 
Arc Ser Leu 



agt git gtt 
Ser Val Val 



get. att cca 
Ala 1 le Pro 
185 

gta tat gca 
Val Tyr Ala 
200 

tct ctt ttt 
Ser Leu Phe 
215 

tat tat gac 
Tyr Tyr Asp 



gaa act tgg 
Glu Thr Trp 



gaa agt . tgg 
Glu Ser Trp 
265 

gta tta gat 
Val Leu Asp 
, 280 

cca acg gga 

Pro Thr Gly 
2 95 

at. I. gta ttt 

He Val Phe 



act aat ccc 
Thr Asn Pro 



cca cca cat 

Pre Pro :iis 
3 4 5 

k- v. r; T. L - C V-O 

7: • ■- - - j ,—. 7! ~ 
- - ^ 

J • • •- , ■€ r - ft * " 

v. •_. : * -« _ v •«« v. 

Lou Arn Arg 
r- 



caa aat tgg 
Gin Asn Trp 
155 

cgt get caa 
Arg Ala Gin 
170 

ttg ttt gca 
Leu Phe Ala 



caa get gtg 
Gin Ala Val 



gga gaa gga 
Gly Glu Gly 

220 

cgt caa ttg 
Arg Gin Leu 
235 

tat aat aca 
Tyr Asn Thr 
250 

tta aga tat 
Leu Arg Tyr 



gtt gtg gcg 
Val Val Ala 



tea aac cca 
Ser Asn Pro 

300 

aat cca cca 
Asn Pro Pro 
315 

tat aat act 
Tyr Asn Thr 
330 

ctt ttt gat 
Leu Phe Asp 



gtt tea tct 
Val Ser Ser 



a q t ta: c t c 
Ser Tyr Leu 
330 



ttq get ga'c 
Leu A^ a Asp 



ttt a t a g c t 
Phe tie Ala 
l'?5 

gta aat gga 
Val Asn Gly 
190 

aat tta cat 
Asn Leu His 
205 

tgg gga ttc 
Trp Gly Phe 



gaa eta acc 
Glu Leu Thr 



ggt tta gat 
Gly Leu Asp 
255 

cat caa ttc 
His Gin Phe 
270 

eta ttt cca 
Leu Phe Pro 
285 

cag ctt aca 
Gin Leu Thr 



get aat gtt 
Ala Asn Val 



ttt net gag 
Phe Ser Glu 
335 

agg ctg aat 
Arg lieu Asn 
3 5 0 

a-jt ttt atg 



aac gat tea 
Asn Asp Ser 



cga 480 

Arg 

160 

tta 528 

Leu 



cag 576 
Gin 



ttg 62 4 
Leu 



<~\ 

aca b / 2 
Thr 



get 720 

Ala 

240 

cgt 7 68 
Arg 

cgt 816 
Arg 



tat 864 
Tyr 



cgt 912 

A r a 



gga 960 

Gly 

320 

etc 1008 
Leu 



age 1056 
Ser 

cat 1104 
_> 

gca 1152 

Ala 



i 
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3 



-;ta caa gaa gat agt ta 4 : qc*: eta att aca acc aca aga oca aca att 1200 
Vrai Gin Glu Asp Ser Tyr Gly Le- He Thr Thr Thr Arg Ala Thr Tie 
m m 390 395 .100 

aat ccc gqa gtt gat gga aca aac cgc ata gag tea acq gca gta gat 1248 
Asr. Pro Gly Val Asp Gly Thr Asn Arg lie Glu Ser Thr Ala Val Asp 

405 410 415 

*:tt cgt Let gca ttg ata gqt ata tat ggc gtg aat aga get ret ttt 1296 
Phe Arg Ser Ala Leu He Gly He Tyr Gly Va 1 Asn Arg Ala Ser Phe 

4 20 4 25 4 30 

gtc cca gga ggc ttg ttt aat ggt acg act tct cct get aat gga gga 134 4 
Va! Pro Gly Gly Leu Phe Asn Gly Thr Thr Ser Pro Ala Asn Gly Gly 
4 35 4 40 445 

tgt aga gat etc tat gat aca aat gat gaa tta cca cca gat gaa agt 1392 
Cys Arg Asp Leu Tyr Asp Thr Asn Asp Glu Leu Pro Pro Asp Glu Ser 
"0 455 460 

acc gga agt tea acc cat aga eta tct cat gtt acc ttt ttt age ttt 1440 
Thr Gly Ser Ser Thr His Arg Leu Ser His Val Thr Phe Phe Ser Phe 
465 470 475 480 

caa act aat eag get gga tct ata get aat gca g'ga agt gta cct act 1488 
Gin Thr Asn Gin Ala Gly Ser He Ala Asn Ala Gly Ser Val Pro Thr 

485 490 495 

tat gtt tgg acc cgt cgt gat gtg gac ctt aat aat acg att acc cca 1536 
Tyr Val Trp Thr Arg Arg Asp Val Asp Leu Asn /\sn Thr He Thr Pro 

500 505 510 

aat aga att aca caa tta cca ttg gta aag gca tct gca cct gtt teg 1584 
Asn Arg He Thr Gin Leu Pro Leu Val Lys Ala Ser Ala Pro Val Ser 
515 520 525 

qqt act acg gtc tta aaa ggt cca gga ttt aca gga ggg ggt ata etc 1632 
Gly Thr Thr Val Leu Lys Gly Pro Gly Phe Thr Gly Gly Gly He Leu 
530 535 54 0 

caa aga aca act aat ggc aca ttt gga acg tta aga qta acg gtt aat 1680 
Arg Arg Thr Thr Asr. Gly Thr Phe Gly Thr Leu Arg Val Thr Val Asn 

550 555 " 560 

t;:a :ca tta aca caa caa tat cgc eta aga gtt cgt ttt gee tea aca 1728 
Ser Pre Leu Thr Gin Gin Tyr Arg Leu Arg Val Arg Phe Ala Ser Thr 

565 570 575 

cqa aat tte agt. ata aqg gra etc cgt gga ggg qtt tct ate ggt gat 1776 
G.y Asn Phe Sar lie Arc Val Leu Arg Gly Gly Val Ser He Gly Asp 

5BC 585 5 90 



" * 1 * " 9'^° 3gc aca at:: aac aga ggg caq gaa eta act t 



ac aaa LS23 

Arg I. -.-j Gly S ^ r ■ ?hr i:e - Asr Arg Gly GIn 31u Le „ Tyr Q ^ 

600 60b 

•f tt- aca 3oa -ag :.!.-■ ~rt act act get req ttc aat ccg c.»t 

^"'"^ Thr Arg G_u PL-? Thr Thr Thr Gly ?.-■_ r-ho Asn Fro Pro 



4 4- * 

• 4 B 

* • « 



:1 



;aa cct caa nag att eta aca gtg ast gca gaa ggt 1920 
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?he Thr Phe Thr 

62 5 



Gin Ala Gin Glu He Leu Thr Val Asn Ala Glu Giy 
630 635 640 



t I 



att age acc ggt'ggt gaa tat tat ata gat aga att gaa att gtc cct 

Val Ser Thr Gly Gly Glu Tyr Tyr He Asp Arg He Glu He Val Pro 

645 650 655 

gtg aat ccg gca cga gaa gcg gaa gag gat tta gaa gcg gcg aag aaa 

Val Asn Pro Ala Arg Glu Ala Glu Glu Asp Leu Glu Ala Ala Lys tys 

660 665 670 



gcg 
Ala 



1968 



2016 



2019 



<210> 2 
<211> 673 
<212> PRT 

<213> Bacillus thuringiensis 
<400> 2 

Met Asn Arg Asn Asn Gin Asn Glu Tyr Glu He He Asp Ala Pro His 
I 5 \ 10 15 



Cys Gly Cys Pro Ser Asp Asp Asp Val Arg Tyr Pro Leu Ala Ser Asp 

20 25 30 

4 

Pro Asn Ala Ala Leu Gin Asn Met Asn Tyr Lys Asp Tyr Leu Gin Met 
35 40 45 

Thr Asp Glu Asp Tyr Thr Asp Ser Tyr He Asn Pro Ser Leu Ser lie 
50 55 60 

Ser Gly Arg Asp Ala Val Gin Thr Ala Leu Thr Val Val Gly Arg He 
65 70 75 80 

Leu Gly Ala Leu Gly Val Pro Phe Ser Gly Gin He Val Ser Phe Tyr 

85 90 95 

Gin Phe Leu Leu Asn Thr Leu Trp Pro Val Asn Asp Thr Ala lie Trp 

1 00 105 HO 

Glu Ala Phe Met Arg Gin Val Glu Glu Leu Val Asn Gin Gin lie Thr 
115 120 125 

Glu Phe Ala Arg Asn Gin Ala Leu Ala Arg Leu Gin Gly Leu Gly Asp 
130 135 140 

Ser Phe Asn Val Tyr Gin Arg Ser Leu Gin Asn Trp Leu Ala Asp Arg 
145 150 155 160 

Asn Asp Thr Arg Asr: Leu Ser Val Val Arg Ala Gin Phe lie Ala Leu 

165 170 175 



A so leu Aso Phe Val Asn Ala He Pro Leu Phe Ala Val Asn S.y o-n 

180 :35 190 



Val ? 



r~. Lou I a\: 



Ser Val Tyr Ala Gin Ala Val Asn Leu His Leu 



200 



\J 



leu Leu Leu Lys Asp Ala Ser Leu Phe Gly Glu Giy Trp Giy Phe Thr 
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210 

Gl:i Gly Glu lie 
2 2' 0 

L y s 7 y r T h r A s n 



Leu Arc Gly Thr 

260 

Arg Glu Met Thr 

<U / .J 

T y r Asp V a i A r g 
290 

Glu Val Tyr Thr 
305 

Leu Cys Arg Arg 



Glu Asn Ala Phe 

340 

Leu Thr lie Ser 
355 

Tyr Trp Ser Gly 
370 

Val Gin Glu Asp 
385 

Asn Pro Gly Val 



Phe Arg Ser Ala 

120 

V«3 Pro Gly Gly 
435 

Cys Arg Asp Leu 

Thr Gly Ser Ser 
4 65 

■' : * :i 7hr Asn Gin 

• ■ . i — >- 
500 

:. A:"*: He Thr 
-» - *. . -li. - . . ~ v a ,t 



215 

Ser Thr Tyr Tyr 
230 

Tyr Cys Glu Thr 
Asn Thr Glu Ser 



Leu Val Val Leu 

230 

Leu Tyr Pre Thr 
295 

Asp Pre lie Val 
310 

Trp Gly Thr Asn 
325 

lie Arg Pro Pro 



Ser Asn Arg Phe 

360 

His Thr Leu Arg 
375 

Ser Tyr Gly Leu 
390 

Asp Gly Thr Asn 
405 

Leu lie Gly He 



Leu Phe Asn Gly 

440 

Tyr Asp Thr Asn 
455 

Thr His Arg Leu 
470 

Ala Gly Ser He 
495 

A r q A r :* Asp V a 1 



Gin Leu Fro Leu 

5 2 0 

Leu Lvs G 1 v Pro 

~- 



220 

Asp Arg Gin Leu 
235 

Trp Tyr Asn Thr 
250 

Trp Leu Arg Tyr 
265 

Asp Val Val Ala 



Gly Ser Asn Pro 

300 

Phe Asn Pro Pro 
315 

Pro Tyr Asn Thr 
330 

His Leu Phe Asp 
345 

Pro Val Ser Ser 



Arg Ser Tyr Leu 

380 

He Thr Thr Thr 
395 

Arg He Glu Ser 
410 

Tyr Gly Val Asn 
425 

Thr Thr Ser Pro 



Asp Glu Leu Pro 

4 60 

Ser His Val Thr 
475 

Ala Asn Ala Gly 
4 90 

Asp Leu Asn A sr. 
505 

Val Lys Ala Ser 



Gly Phe Thr Gly 

540 



Glu Leu Thr Ala 

240 

Gly Leu Asp Arg 
255 

His Gin Phe Arg 
270 

Leu Phe Pro Tyr 
285 

Gin Leu Thr Arg 



Ala Asn Val Gly 

320 

Phe Ser Glu Leu 
335 

Arg Leu Asn Ser 
350 

Asn Phe Met Asp 
365 

Asn Asp Ser Ala 



Arg Ala Thr He 

400 

Thr Ala Val Asp 
415 

Arg Ala Ser Phe 
430 

Ala Asn Gly Gly 
445 

Pro Asp Glu Ser 



Phe Phe Ser Phe 

480 

Ser Val Pro Thr 
4 95 

Thr lie Thr Pro 
5:0 

AJ a Pre Val Ser 
525 

Gly Gly He Leu 
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Arq Arg Thr Thr Asn Gly 7hr ?he Gly Thr Leu Arg Val Thr Val Asn 
545 * 350 "5 560 

Ser- Pro Leu Thr Gin Gin Tyr Arg Leu Arg Val Arg Phe Ala Ser Thr 

56b 570 575 

Gly Asn Phe Ser lie Arg VaJ Leu Arg Gly Gly Val Ser He Gly Asp 

580 585 590 

Val Arg Leu Gly Ser Thr Met Asn Arg Gly Gin Glu Leu Thr Tyr Glu 
595 600 605 

S~r Phe Phe Thr Arg Glu Phe Thr Thr Thr Gly Pro Phe Asn Pro Pro 
610 615 - 620 

Phe Thr Phe Thr Gin Ala Gin Glu He Leu Thr Val Asn Ala Glu Gly 
625 630 635 640 

Val Ser Thr Gly Gly Glu Tyr Tyr He Asp Arg He Glu He Val Pro 



645 



650 



655 



Val Asn Pro Ala Arg Glu Ala Glu Glu Asp Leu Glu Ala Ala Lys Lys 

660 665 670 

Ala 



<210> 3 
<211> 2019 
<212> ADN 

<213> Sequence artif icielle 
<220> 

<223> Description de la sequence art i f icielle : Cry9Cal Leu-164 

<220> 

<221> CDS 

<222> (1) . . (2019) 

<400> 3 

atg aat cga aat aat caa aat gaa tat gaa att att gat gcc ccc cat 46 

Mef Asn Arg Asn Asn Gin As:: Glu Tyr Glu He lie Asp Ala Pro His 
15 10 15 



tgt ggg tgt cca tea gat gac g 



t gtg agg tat cct ttg gca agt gac 96 
Cys Gly Cys Pro Ser Aso Asp Asp Val Arg Tyr Pro Leu Ala Ser Asp 

20 25 30 



cca aat gca gcg tta caa a a ate aac tat aaa gat tac tta caa atg 144 
Pro Asn Ala Ala Leu Gin A sr. Met Asn Tyr Lys Asp Tyr Leu Gin Met 

4 5 



3 5 



< i • 



hcc*. gar. gag gac lac ac~ a r r 
Thr Asp Glu Asp Tyr Thr 

5 :J 5 r - 



■ r; tat ata aat cct agt tta tct att 
S> : r Tvr He Asn Pro Ser Leu Ser He 



192 



agi aga gat oca g- car; rL gcg ctt act gtt qtt ggg aga ata 24 0 

o 01 ,;; ly Arg Asp Ala Val Gin Thr Ala Leu Thr Val Val Gly Arg He 
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65 70 75 80 

etc ggg get tta~ggt gtt ccg ttt tct gga caa ata gtg agt ttt tat 288 

Leu Gly Ala Leu Gly Val Pro Phe Ser Gly Gin He Val Ser Phe Tyr 

85 90 95 

caa ttc ctt tta aat aca ctg tgg cca gtt aat gat aca get ata tgg 336 

Gin Phe Leu Leu Asn Thr Leu Trp Pro Val Asn Asp Thr Ala He Trp 

100 105 110 

gaa get ttc atg cga cag gtg gag gaa ctt gtc aat caa caa ata aca 384 

Glu Ala Phe Met Arg Gin Val Glu Glu Leu Val Asn Gin Gin He Thr 
115 120 125 

gaa ttt gca aga aat cag gca ctt gca aga ttg caa gga tta gga gac 432 

Glu Phe Ala Arg Asn Gin Ala Leu Ala Arg Leu Gin Gly Leu Gly Asp 
130 135 ,140 

tct ttt aat gta tat caa cgt tec ctt caa aat. tgg ttg get gat cga 480 

Ser Phe Asn Val Tyr Gin Arg Ser Leu Gin Asn'jTrp Leu Ala Asp Arg 
145 150 155 I 160 

aat gat aca tta aat tta agt gtt gtt cgt get -caa ttt ata get tta 528 

Asn Asp Thr Leu Asn Leu Ser Val Val Arg Ala Gin Phe He Ala Leu 

165 170 * 175 

gac ctt gat ttt gtt aat get att cca ttg ttt "gca gta aat gga cag 576 

Asp Leu Asp Phe Val Asn Ala lie Pro Leu Phe ^Ala Val Asn Gly Gin 

180 . 185 190 

cag gtt cca tta ctg tea gta tat gca caa get gtg aat tta eat ttg 624 

Gin Val Pro Leu Leu Ser Val Tyr Ala Gin Ala »Val Asn Leu His Leu 
195 200 205 

tta tta tta aaa gat gca tct ctt ttt gga gaa gga tgg gga ttc aca 672 

Leu Leu Leu Lys Asp Ala Ser Leu Phe Gly Glu .Gly Trp Gly Phe Thr 



210 215 



220 



cag ggg gaa att tec aca tat tat gac cgt caa 'ttg gaa eta acc get 720 

GLn Gly Glu He Ser Thr Tyr Tyr Asp Arg Gin Leu Glu Leu Thr Ala 

225 230 235 ' 240 

aag tac act aat tac tgt gaa act tgg tat aat aca ggt tta' gat cgt 768 

Lys Tyr Thr Asn Tyr Cys Glu Thr Trp Tyr Asn .Thr Gly Leu Asp Arg 

245 250 ; 255 

tta aga gga aca aat act gaa agt tgg tta aga tat cat caa ttc cgt 816 

Leu Arg Gly Thr Asn Thr Glu Ser Trp Leu Arg Tyr His Gin Phe Arg 

260 265 270 

aga gaa atg act tta gtg gta tta gat gtt gtg gcg eta ttt cca tat 864 

Arg Glu Met Thr Leu Val Val Leu Asp Val Val Ala Leu Phe Pro Tyr 
~5 280 285 



2 7 



to*: gac gta cca crt :aL cca a eg gga tea aac cca cag ctt aca ccc 912 

'I'Yi Asp Val Arg Leu Tyr Pre Thr Gly Ser Asn Pro Gin Leu Thr Arg 

-SO ?.?5 300 

gaq gt.a tat aca gat ccg itt gta ttt aat cca cca get aat gtc gga 360 

Glu Val Tyr 7hx Asp Pro He Val Phe Asn Pro Pro Ala Asn Val Gly 

310 315 320 
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r*t rqn cga cgt tog ggt act aat ccc tat aat act ttt tct gag etc 
Cvs Arg Arg-7rp Gly Thr Asn Pro Tyr Asn Thr Phe Ser Glu Leu 

??5 330 335 



1008 



go a aat gec ttc a 



t- r: 



zqc cca cca cat ctt ttt gat agg ctg aat age 



Giu Asn Ala Phe lie Arq Pro Pro His Leu Phe Asp Arg Leu Asn Ser 



3 '1 0 



3 4 5 



350 



1056 



tta aca ate age agt aat cga ttt cca gtt tea tct aat ttt atg gat 
Leu Thr He Ser Ser Asn Arq Phe Pro Val Ser Ser Asn Phe Met Asp 
355 360 365 

tat tgg tea gga cat acg tta cgc cgt agt tat ctg aac gat tea gca 
Tyr Trp Ser Gly His Thr Leu Arg Arg Ser Tyr Leu Asn Asp Ser Ala 
370 375 380 



1104 



1152 



gta caa gaa gat agt tat ggc eta att aca ace aca aga gca aca att 
Val Gin Glu Asp Ser Tyr Gly Leu He Thr Thr Thr Arg Ala Thr He 
385 390 395 400 



1200 



aat ccc gga gtt gat gga aca aac cgc ata gag tea acg gca gta gat 
Asn Pro Gly Val Asp Gly Thr Asn Arg He Glu Ser Thr Ala Val Asp 

405 410 415 

ttt cgt tct gca ttg ata ggt ata tat ggc gtg aat aga get tct ttt 
Phe Arg Ser Ala Leu Ile-Gly He Tyr Gly Val Asn Arg Ala Ser Phe 

420 425 430 



1248 



1296 



gtc cca gga ggc ttg ttt aat ggt acg act tct cct get aat gga gga 
Val Pro Gly Gly Leu Phe Asn Gly Thr Thr Ser Pro Ala Asn Gly Gly 
435 4 40 .4 4 5 



1344 



tgt aga gat etc tat gat '"aca aat gat gaa tta cca cca gat gaa agt 
Cys Arg Asp Leu Tyr Asp : Thr Asn Asp Glu Leu Pro Pro Asp Glu Ser 
4 50 4 55 4 60 



1392 



ace gga agt tea ace cat. aga eta tct cat gtt ace ttt ttt age ttt 
Thr GW Ser Ser Thr His Arg Leu Ser His Val Thr Phe Phe Ser Phe 
465 470 475 480 



1440 



caa act aat cag qct gga tct ata get aat gca gga agt gta cct act 
Gin Thr Asn Gin Ala Gly Ser He Ala Asn Ala Gly Ser Val Pro Thr 

485 490 495 



14 88 



tat gtt tgg ace cgt cgt gat gtg gac ctt aat aat acg att ace cca 
- y v val Tro Thr Arc Arg Asp Val Asp Leu Asn Asn Thr He Thr Pro 

500 505 510 



1536 



- i- 

O 'J u 



,S 



aga att aca 
Arci He T h r 



caa tta cca ttg gta aac gca tct gca cct gtt teg 
Gin Leu Pro Leu Val Lys Ala Ser Ala Pro Val Ser 



r; ~» f- 



1584 



v acr ric:: g~ 
y ?r.r Thr Vy 



4 » -S 



i a a c g t c c: a 
Leu Lys Gly Pre 



cga ttt aca gga egg ggt 
L: ... v i- he 



c:t_c 



- r>r r;i v 3iv Glv He Leu 



163T 



» •'. v 'i'! 



a c 3 a c l 
7 h r '1 h r 



a a 

-s ^ 



v ggc 
n Gly 
550 



u _ 

Thr 



J : z t 
Pho 



a c g tta a g -i 
Thr Leu Ar *: 

r„ ~. c. 



4 z a acg g t 
Val. Thr Va 



aac 
Asn 
z- 1> u 



J 68 'J 



1er depot 



9 



" " r - r 'ca tta aca caa caa tat cgc eta aga gtt cc; itt gec tea aca 
:Uer Pro Leu Thr Gin Gin Tyr Arg Leu Arg Va 1 Arg ?he Ala Ser Thr 

-565 570 



r n c 



1728 



-iga aat ttc agt ata agg g:a ete cgt gga ggg gtt tet ate ggt gat 
Gly Asn Phe Ser He Arg Val Leu Arg Gly Gly Val Ser He Gly Asp 



580 



585 



590 



1776 



gtt aga tta ggg age aca atg aac aga ggg cag gaa eta act tac gaa 
Val Arg Leu Gly Ser Thr Met Asn Arg Gly Gin C3 u Leu Thr Tyr Glu 
5 95 600 605 



1824 



ttt ttc aca aga gag ttt act: act act ggt ccg ttc aat ccg cct 
Phe Phe Thr Arg Glu Phe Thr Thr Thr Gly Pro Phe Asn Pro Pro 



610 



615 



620 



1872 



ttt aca ttt aca caa get caa gag att eta aca gtg aat gca gaa ggt 
Fhe Thr Phe Thr Gin Ala Gin Glu lie Leu Thr Val Asn Ala Glu Gly 
625 630 635 " 640 



1920 



gtt age acc ggt ggt gaa tat tat ata gat aga att gaa att gtc cct 
Val Ser Thr Gly Gly Glu Tyr Tyr He Asp Arg He Glu lie Val Pro 

6^5 650 655 



1968 



gtg aat ccg gca cga gaa gcg gaa gag gat tta gaa gcg gcg aag aaa 
Val Asn Pro Ala Arg Glu Ala Glu Glu Asp Leu Glu Ala Ala Lys Lys 

660 665 670 



2016 



gcg 
Ala 



2019 



<210> 4 
<211> 673 
<212> PRT 

<213> Sequence artificielle 

<223> Description de la sequence artificielle: 



Cry9Cal Leu-164 



<A00> 4 

Hot Asn Arg Asn Asn Gin Asn Glu Tyr Glu He Tie Asp Ala Pro His 

3 10 15 

Cys Gly Cys Pro Ser Asp Asd Asp Val Arg Tyr Pro Leu Ala Ser Asp 

20 25 30 

Pro Asn Ala Ala Leu Gin Asn Met Asn Tyr Lys Asp Tvr Leu Gin Met 
35 4 0 4 5 



Thr Asp Glu Asp Tyr Thr Asp Ser Tyr He Asn Pro Ser Leu Ser H e 

60 



— ^ :z '~y - a '3p Ala Val Gin Thr Ala Leu Thr Val Val Gly Arg He 



7 0 



8C 



i • 



Leu c:y Va 1 Pro Phe Ser Gly Gin lie Val Ser Phe Tvr 
?b 90 cc, 



: i -e leu L" u A s r. ? h r L-s \: 

irj 



Trp Pre Vci Asn Asp Thr Ala He 7r 



:05 



.1 10 



vIj A:^ Phe Met Are Gin V;,l Glu Glu Leu Val Asr. Gin Gin II* 



- Thr 



1 er depot 
10 



115 120 12 



Glu Phe Ala Arg.Asn Gin Ala Leu Ala Arg Leu Gin G:y Leu Gly Asp 
120 135 140 

Ser »hp Asm Val Tyr Gin Arg Ser Leu Gin Asn Trp Leu Ala Asp Arg 
145- 150 155 , 160 

» 

Asn Asp Thr Leu Asn Leu Ser Val Val Arg Ala Gin Phe lie Ala Leu 

165 170 1^5 

Asp Leu Asp Phe Val Asn Ala lie Pro Leu Phe Ala Val Asn Gly Gin 

180 1B5 190 

Gin Val Pro Leu Leu Ser Val Tyr Ala Gin Ala Val Asn Leu His Leu 
195 200 205 

Leu Leu Leu Lys Asp Ala Ser Leu Phe Gly' Glu Gly Trp Gly Phe Thr 
210 215 220 . 

Gin Gly Glu lie Ser Thr Tyr Tyr Asp Arg Gin Leu Glu Leu Thr Ala 
225 230 235 240 

* 
i 

Lys Tyr Thr Asn Tyr Cys Glu Thr Trp Tyr Asn Thr Gly Leu Asp Arg 

24 5 250 255 

Leu Arg Gly Thr Asn Thr Glu Ser Trp Leu Arg Tyr His Gin Phe Arg 

260 . . 265 270 

Arg Glu Met Thr Leu Val Val Leu Asp Val Val Ala Leu Phe Pro Tyr 
275 280 285 

Tyr Asp Val Arg Leu Tyr Pro Thr Gly Ser Asn Pro Gin Leu Thr Arg 
290 ; 295 300 

Glu Val Tyr Thr Asp Pro lie Val Phe Asn Pro Pro Ala Asn Val Gly 

305 3l6 315 320 

> 

Leu Cys Arg Arg Trp Gly Thr Asn Pro Tyr Asn Thr Phe Ser Glu Leu 

325 330 335 

Glu Asn Ala Phe lie Arg Pro Pro His Leu Phe Asp Arg Leu Asn Ser 

340 345 350 

Leu Thr He Ser Ser Asn Arg Phe Pro Val Ser Ser Asn Phe Met Asp 
355 360 365 

Tyr Trp Ser Gly His Thr Leu Arg Arg Ser Tyr Leu Asn Asp Ser Ala 
370 " 375 380 

Val Gin Glu Aso Ser Tyr Gly Leu He Thr Thr Thr Arg Ala Thr lie 
395 " 3 90 395 4 00 



Gly Val Asp Gly Thr Asn .Arg He Glu Ser Thr Ala Val Asp 
105 4 10 



Ar«; Sei Ala Lev: He Glv He Tyr Gly Val Asn Arq Ai.a oer Pne 

4 2 5 3 0 



a) Pro Gly Sly Leu Phe Asn Gly Thr Thr Ser Pre Ala Asn Gly Gly 
4 35 4 40 44 5 



Cys Arg Asp Leu 
450 

Thr Gly Ser Ser 
4 65 

Glrs Thr Asn C : I n 



Tyr 7a 1 Trp Thr 

Asn Arg lie Thr 
515 

Gly Thr Thr Val 
530 

Arg Arg Thr Thr 
54 5 

Ser Pro Leu Thr 



Gly Asn Phe Ser 

580 

Val Arg Leu Gly 
595 

Ser Phe Phe Thr 
610 

Phe Thr Phe Thr 
625 

Val Ser Thr Gly 



Tyr Asp Thr Asn 
455 

Thr His Arg Leu 
4 70 

Ala Gly Ser Tie 
485 

Arg Arg Asp Vai 



Gin Leu Pro Leu 

520 

Leu Lys Gly Pro 
535 

Asn Gly Thr Phe 
550 

Gin Gin Tyr Arg 
565 

lie Arg Val Leu 



Ser Thr Met Asn 

600 

Arg Glu Phe Thr 
615 

Gin Ala Gin Glu 
630 

Gly Glu Tyr Tyr 
645 



1er depot 
11 



Asp Glu Leu Pro 

460 

Ser His Val Thr 
475 

Ala Asn Ala Gly 
490 

Asp Leu Asn Asn 
505 

Val Lys Ala Ser 



Gly Phe Thr Gly 

540 

Gly Thr Leu Arg 
555 

Leu Arg Val Arg 
570 

Arg Gly Gly Val 
585 

Arg Gly Gin Glu 



Thr Thr Gly Pro 

620 

He Leu Thr Val 
635 

He Asp Arg He 
650 



Pro Asp Glu Ser 



Phe Phe Ser Phe 

480 

Ser Val Pro Thr 
495 

Thr He Thr Pro 
510 

Ala Pro Val Ser 
525 

Gly Gly He Leu 



Val Thr Val Asn 

560 

Phe Ala Ser Thr 
575 

Ser He Gly Asp 
590 

Leu Thr Tyr Glu 
605 

Phe Asn Pro Pro 



Asn Ala Glu Gly 

640 

Glu He Val Pro 
655 



Vril Asn Pro Ala Arg Glu Ala Glu Glu Asp Leu Glu Ala Ala Lys Lys 

660 665 670 



1er depot 



12 



atg aat cga aat aat caa aat gaa tat gaa att att gat gcc ccc cat 
Me!- Asn Arg Asn Asn Gin Asn Glu Tyr Glu He He Asp Ala Pro His 
1-5 10 15 

tgt ggg tgt cca tea gat gac gat gtg agg tat cct ttg gca agt gac 
Cys Gly Cys Pro Ser Asp Asp Asp Val Arg Tyr Pro Leu Ala Ser Asp 

20 25 30 

cca aat gca gcg tta caa aat atg aac tat aaa gat tac tta caa atg 
Pro Asn Ala Ala Leu Gin Asn Met Asn Tyr Lys Asp Tyr Leu Gin Met 
35 40 45 

aca gat gag gac tac act gat tct tat ata aat cct agt tta tct att 
Thr Asp Glu Asp Tyr Thr Asp Ser Tyr He Asn Pro Ser Leu Ser He 
50 55 60 

agt ggt aga gat gca gtt cag act gcg ctt act gtt gtt ggg aga ata 
Ser Gly Arg Asp Ala Val Gin Thr Ala Leu Thr Val Val Gly Arg He 
65 70 - 75 80 

etc ggg get tta ggt gtt ccg ttt tct gga caa ata gtg agt ttt tat 
Leu Gly Ala Leu Gly Val Pro Phe Ser Gly Gin He Val Ser Phe Tyr 

85 " 90 95 



43 



* 

gaa get ttc atg cga cag gtg gag gaa ctt gtc aat caa caa ata aca 
Glu Ala Phe Met Arg Gin Val Glu Glu Leu Val Asn Gin Gin He Thr 
115 120 125 



tct ttt aat gta tat caa cgt tec ctt caa aat tgg ttg get gat cga 

Ser Phe Asn Val Tyr Gin Arg Ser Leu Gin Asn Trp Leu Ala Asp Arg 
145 150 "'■ 155 160 

aat gat aca ttt aat tta agt gtt gtt cgt get caa ttt ata get tta 

Asn Asp Thr Phe Asn Leu Ser Val Val Arg Ala Gin Phe He Ala Leu 

165 • 170 • 175 

gac ctt gat ttt gtt aat get att cca ttg ttt gca gta aat gga cag 

Asp Leu Asp Phe Val Asn Ala He Pro Leu Phe Ala *Val Asn Gly Gin 

180 185 190 



96 



144 



192 



240 



288 



caa ttc ctt tta aat aca ctg tgg cca gtt aat gat aca get ata tgg 336 
Gin Phe Leu Leu Asn Thr Leu Trp Pro Val Asn Asp Thr Ala He Trp 

100 105 HO 



384 



gaa ttt gca aga aat cag gca ctt gca aga : ttg caa gga tta gga gac 432 
Glu Phe Ala Arg Asn Gin Ala Leu Ala Arg Leu Gin Gly Leu Gly Asp 
130 135 140 



480 



528 



57 6 



cag gtt cca tta ctg tea gta tat gca caa get gtg aat tta cat ttg 624 

Gin Val Pro Leu Leu Ser Val Tyr Ala Gin Ala Val Asn Leu His Leu 

195 200 205 

tta tta tta aaa gat gca tc: ctr ttt gga gaa gga tgg gga ttc aca 6~?2 

leu Leu Leu Lys Asp Ala Ser Leu Phe Gly Glu Gly Trp Gly Phe Thr 

210 215 220 

■::a-. qcn qaa att tec aca ta~ tat gac cgt caa ttg gaa eta acc get 720 

Gin Gly Glu lie Ser Thr Tyr Tyr Asp Arg Gin Leu Glu Leu Thr Ala 

2?.b 230 ' 235 240 

aac: tac act aat tac tgt gac acr. tgg tat aat aca ggt tta gat cgt 768 



1er depot 
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Lys Tyr Thr Asn Tyr Cys G: u Thr Trp Tyr Asn Thr Gly Leu Asp Arg 

2*5 250 255 



tta aga qqa aca aat ac: gaa agt tgg tta aga tat cat caa ttc cgt 

y Thr Asn Thr: Glu Ser Trp Leu Arg Tyr His Gin Phe Arg 
260 265 270 



Leu Arg Gl 



816 



aga gaa atg act tta gtg gta tta gat gtt gtg gcg eta r.tt cca tat 
Arg Glu Met Thr Leu Val Val Leu Asp Val Val Ala Leu Phe Pro Tyr 
275 28C 235 



8 64 



tat gat gta eg a ct*. tat c c a 
Tyr Asp Vai Arg Leu Tyr rrc 
2 90 



acg qqa tea aac cca cag ctt aca cgt 
Thr Gly Ser Asn Pro Gin Leu Thr Arg 

300 



912 



gag gta tat aca gat ccg att gta ttt aat cca cca get aat gtt gga 
Glu Val Tyr Thr Asp Pro lie Val Phe Asn Pro Pro Ala Asn Val Gly 
305 310 315 320 



960 



ctt tgc cga cgt tgg ggt act aat ccc tat aat act ttt tct gag etc 
Leu Cys Arg Arg Trp g!v Thr Asn Pro Tyr Asn Thr Phe Ser Glu Leu 

325 330 335 



1008 



gaa aat gec ttc att cgc cca cca cat ctt ttt gat agg ctg aat age 
Glu Asn Ala Phe lie Arg Pro Pro His Leu Phe Asp Arg Leu Asn Ser 

340 345 350 



105 6 



tta aca ate age agt aat cga ttt cca gtt tea tct aat ttt atg gat 
Leu Thr He Ser Ser Asn Arg Phe Pro Val Ser Ser Asn Phe Met Asp 
355 360 , 365 



1104 



tat tgg tea gga cat acg tta cgc cgt agt tat 'ctg aac gat tea gca 
Tyr Trp Ser Gly His Thr Leu Arg Arg Ser Tyr .Leu Asn Asp Ser Ala 
370 375 380 



1152 



gta caa gaa gat agt tat ggc eta att aca ace aca aga gca aca att 
Val Gin Glu Asp Ser Tyr Gly Leu He Thr Thr Thr Arg Ala Thr He 
385 390 395 " 400 



1200 



aat ccc gga gtt gat gga aca aac cgc ata gag tea acg gca gta gat 
Asn Pro Gly Val Asp Gly Thr Asn Arg He Glu Ser Thr Ala Val Asp 

405 410 415 



1248 



ttt cgt tct gca ttq ata get ata tat ggc gtg aat aga get tct ttt 
Phe Arg Ser Ala Leu He Gly Tie Tyr Gly Val Asn Arg Ala Ser Phe 

4 20 4 25 4 30 



1296 



gtc cca gga ggc ttg ttt aat ggt acg act tct cct get aat gga gga 



no K,ty Gly Leu Phe Asn Gly Thr Thr Ser Pro Ala Asn Gly Gly 



-3 *i -j 



445 



1344 



t q t a q a a 
C y s A i" e A s 
•1: v 



t a 



cat = aat gat gaa tta cca cca gat ga 



\ s p Thr 



3r. Asp Glu Leu Pre 

4 60 



Asp Glu : r ^r 



I 



a c c a t i 
7 h r Mi.- ~ 



eta tct cat gtt acc ttt ttt 
: Let Ser His Val Thr Phe Phe 

4 75 



4 O 



■? act aav cac 



C-:r. Thr As:- 



J g-" "-a tct ata get aat gca 70a agt gta cct act 
: AU Gly Ser He Ala Asn Ala Gly Ser Val Pre Thr 



1 ^ A ? 



1er depot 
14 



4 



490 495 



t-at gtt egg acc*cgt cgt gat gtg gac ctt aat aat acq att acc cca 
T V r Val Trp Thr Arq Arg Asp Val Asp Leu Asn Asn Thr lie Thr Pro 

00 505 510 



5° 



gtt aga tta ggg age aca a€g aac aga ggg cag gaa eta act tac gaa 

Val Arg Leu Gly Ser Thr Met Asn Arg Gly Gin Glu Leu Thr Tyr Glu 
595 ' 600 605 

tec ttt ttc aca aga gag ttt act act act ggt ccg ttc aat ccg cct 

Ser Phe Phe Thr Arg Glu Phe Thr Thr Thr Gly Pro . Phe Asn Pro Pro 
610 615 620 

ttt aca ttt aca caa get caa gag att eta aca gtg aat gca gaa ggt 

Phe Thr Phe Thr Gin Ala Gin Glu lie Leu Thr Val Asn Ala Glu Gly 

630 ' 635 640 



6 



25 



gtt age acc ggt ggt gaa tat tat ata gat aga att gaa att gtc cct 
Val Ser Thr Glv Gly Glu Tyr Tyr He Asp Arg He Glu He Val Pro 

64 5 650 655 



•- <; f 



bU 



665 670 



gcg 
Ala 



<210> 6 

<211> 67 3 

<212> PR7 

<2i3> Seou'r:v-.' ~.r- i :~ : c i ellc 

<223> Peser ij: ». - la seer.: t- a rt i f icielle : Cry'^Ca; Phc-lf-i 

<-\::*Z> 6 

Mo;: Asn Ar:: A":: C-lr. As:'; .L'. J Tyr Glu He He A~p Ala Pr: Mis 



15 36 



aai- aga azl aca caa tta cca tt.g gta aag gca tct gca cct gtt ccg 1584 

Asn Arg He Thr Gin Leu Pre Leu Val Lys Ala Ser Ala Pro Val S-er 
515 520 525 

gat act acg ::tc tta aaa ggt cca gga ttt aca gga ggg ggt ata etc 1632 

Gly Thr Thr Val Leu Lys Gly Pro Gly Phe Thr Gly Gly Gly He Leu 
530 535 540 

cga aga aca act aat ggc aca ttt gga acg tta aga gta acg gtt aat 1680 

Arg Arg Thr Thr Asn Gly Thr Phe Gly Thr Leu Arg Val Thr Val Asn 

545 550 555 560 

tea cca tta aca caa caa tat cgc eta aga gtt cgt ttt gec tea aca 1728 

Ser Pro Leu Thr Gin Gin Tyr Arg Leu Arg Val Arg Phe Ala Ser Thr 

565 570 575 

gga aat ttc agt ata agg gta etc cgt gga ggg gtt tct ate ggt gat 1776 
Gly Asn Phe Ser He Arg Val Leu Arg Gly Gly Val Ser He Gly Asp 

580 ' 585 590 



1824 



1872 



1920 



1968 



gtg aat ccg yea cga gaa gcg gaa gag gat tta gaa gcg gcg aag aaa 2016 
Val Asn Pro Ala Arg Glu Ala Glu Glu Asp Leu Glu Ala Ala Lys Lys 



2019 



10 15 



Cys Gly Cys Pre Scr Asp Asp Asp Val Arg Tyr Pro Leu Ala Ser Asp 



1 er depot 
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^ » J 25 3 J 

L-ro Asr, Ala Ale •l.eu Gin Asn Met Asn Tyr Lys Asp Tyr Leu Gin Met 
35 4 0 4 5 

Thr Asp Glu Asp Tyr Thr Asp Ser Tyr lie Asn Pro Ser Leu Ser lie 

50 55 60 

Ser Gly Arc Asp Ala Va i Gin Thr Ala Leu Thr Val Val. Gly Arg He 
65 70 7 5 50 

Leu Gly Ala Leu Gly Val ?rc Phe Ser Gly Gin He Val Ser Phe Tyr 

35 90 95 

Gin Phe Leu Leu Asn Thr Leu Trp Pro Val Asn Asp Thr Ala He Trp 

100 ' 105 110 

Glu Ala Phe Met Arg Gin Val Glu Glu Leu Val Asn Gin Gin He Thr 
115 120 125 

Glu Phe Ala Arg Asn Gin Ala Leu Ala Arg Leu Gin Gly Leu Gly Asp 
130 135 140 

Ser Phe Asn Val Tyr Gin Arg Ser Leu Gin Asn Trp Leu Ala Asp Arg 
145 150 155 160 

Asn Asp Thr Phe Asn Leu Ser Val Val Arg Ala Gin Phe He Ala Leu 

165 170 175 

Asp Leu Asp Phe Val Asn Ala He Pro Leu Phe Ala Val Asn Gly Gin 

180 185 190 

Gin Val Pro Leu Leu Ser Val Tyr Ala Gin Ala Val Asn Leu His Leu 
195 200 205 

Leu Leu Leu Lys Asp Ala Ser Leu Phe Gly Glu Gly Trp Gly Phe Thr 
210 215 220 

Gin Gly Glu He Ser Thr Tyr Tyr Asp Arg Gin Leu Glu Leu Thr Ala 
225 230 235 240 

Lys Tyr Thr Asn Tyr Cys Glu Thr Trp Tyr Asn Thr Gly Leu Asp Arg 

245 250 255 

Leu Arg Gly Thr Asn Thr Glu Ser Trp Leu Arg Tyr His Gin Phe Arg 

260 265 270 

Arg Glu Met Thr Leu Val Val Leu Asp Val Val Ala Leu Phe Pro Tyr 
275 23C 285 

Tyr Asp Va ; Ar<j Lcn Tyr Pro Thr Gly Ser Asn Pro Gin Leu Thr Arg 



lu Val Tyr Thr Asp fro liu 7*1 Phe Asn Pro Pre Ala Asn Val Gly 

— 31"^ 315 320 

-n. Vys Ar.j A;-- Trp Gly Tr.r Asr: Pro Tyr Asn Thr The Ser Glu Leu 

; - : -r 330 33! 

:1 . u Asn Ala I he- hi-; Ar.j r r t Pro His Leu Phe Asp Arg Leu Asn Ser 

H- 34 5 35-1 
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Leu Thr He Ser Ser Asn Arg Phe Pro Val Ser Ser Asn Phe Met Asp 
355 _ 360 365 

Tyr Trp Ser Gly His Thr Leu Arc Arg Ser Tyr Leu Asn Asp Ser Ala 
37 0 37 5 380 



Val Gin Glu Aso Ser Tyr Glv Leu He Thr Thr Thr Arg Ala Thr ' He 
385 390 395 4*00 

Asn Pro Gly Val Asd Gly Thr Asn Arg Tie Glu Ser Thr Ala Val Asp 

405 410 415 

Phe Arg Ser Ala Leu He Gly He Tyr Gly Val Asn Arg Ala Ser Phe 

420 425 430 

Val Pro Gly Gly Leu Phe Asn Gly Thr Thr Ser Pro Ala Asn Gly Gly 
4 35 4 40 445 

Cys Arg Asp Leu Tyr Asp Thr Asn Asp Glu Leu Pro Pro Asp Glu Ser 
4 50 i 4 55 4 60 

i 

Thr Gly Ser Ser Thr His Arg Leu Ser His Val Thr Phe Phe Ser Phe 
465 470 475 480 

Gin Thr Asn Gin Ala Gly Ser He Ala Asn Ala Gly Ser Val Pro Thr 

485 : 490 495 

Tyr Val Trp Thr Arg Krg Asp Val Asp Leu Asn Asn Thr lie Thr Pro 

500 ■.! 505 510 

Asn Arg He Thr Gln' ? Leu Pro Leu Val Lys Ala Ser Ala Pro Val Ser 

515 I 520 525 

Gly Thr Thr Val Leu Lys Gly Pro Gly Phe Thr Gly Gly Gly He Leu 
530 1 535 540 

Arg Arg Thr Thr Asn Gly Thr Phe Gly Thr Leu Arg Val Thr Val Asn 
545 550 555 560 

Ser Pro Leu Thr Gin 'Gin Tyr Arq Leu Arg Val Arg Phe Ala Ser Thr 

565 570 575 

Gly Asn Phe Ser lie Arg Val Leu Arg Gly Gly Val Ser lie Gly Asp 

580 585 590 

Val Arg Leu Gly Ser Thr Met Asn Arg Gly Gin Glu Leu Thr Tyr Glu 
595 • 600 605 

Gar ?he Phe Thr Arg Glu Phe Thr Thr Thr Gly Pro Phe Asn Pro Pro 

6:o e:: 620 

?he Thr Phe Thr Gin Ala G] n C.u He Leu Thr Val Asn Ala Glu Gly 
625 63C 635 640 

va: Ser Thr Gly Gly Glu Tyr Tie Asp Arc lie Glu lie Val Pro 

64 5 S5C 655 

VaJL Asn Pro Ala Arg Glu AH Slu 01m Asp Leu Glu Ala Ala Lys Lys 

660 065 670 
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Ala 



<210> 7 
<21i> 2010 
<212> ADN 

<213> Sequence artificielle 
<22C> 

<223> Description de la sequence ar I i f" i c ie 1 le : Cry9Cal Glu-164 

<220> 

<221> CDS 

<222> (1) . . (2019) 

<400> 7 

atg aat cga aat aat caa aat gaa tat gaa att att gat gcc ccc cat 48 

Met Asn Arg Asn Asn Gin Asn Giu Tyr Glu lie lie Asp Ala Pro His 

15 10 15 

tgt ggg tgt cca tea gat gac gat gtg agg tat cct ttg gca agt gac 96 
Cys Gly Cys Pro Ser Asp Asp Asp Val Arg Tyr Pro Leu Ala Ser Asp 

20 25 30 

cca aat gca gcg tta caa aat atg aac tat aaa gat tac tta caa atg 144 
Pro Asn Ala Ala Leu Gin Asn Met Asn Tyr Lys Asp Tyr Leu Gin Met 
35 40 45 

aca gat gag gac tac act gat tct tat ata aat cct agt tta tct att 192 
Thr Asp Glu Asp Tyr Thr Asp Ser Tyr He Asn Pro Ser Leu Ser He 
50 55 60 

agt ggt aga gat gca gtt cag act gcg ctt act gtt gtt ggg aga ata 240 
Ser Gly Arg Asp Ala Val Gin Thr Ala Leu Thr Val Val Gly Arg He 
" 70 75 80 

etc ggg get tta ggt gtt ccg ttt tct gga caa ata gtg agt ttt tat 288 
Leu Gly Ala Leu Gly Val Pro Phe Ser Gly Gin He Val Ser Phe Tyr 

85 90 95 

caa ttc ctt tta aat aca ctg tgq cca gtt aat gat aca get ata tgg 336 
Gin Phe Leu Leu Asn Thr Leu Trp Pro Val Asn Asp Thr Ala lie Trp 

i00 105 110 

gaa cct ttc atg cga cag gtg gag gaa ctt gtc aat caa caa ata aca 384 
Glu Ala Phe Met Arg Gin Val Glu Giu Leu Val Asn Gin Gin He Thr 
1*5 12C 125 

gaa ttt oca aaa aat cag oca ctt oca aga ttg caa gga tta gga gac 432 

Glu Phe A] a Arc Asp. Gin Ala Leu Ala Arg Leu Gin Gly Leu Glv Asp 
130 135 14 0 

\y. aat gta tat caa cat t ::c ctt caa aat teg ttc get gat cga 480 

i'<ir rr.'-i Asn Va: 'Tyr GJ n Arc Scr Leu Gin Asn Trp Leu Ala Asp Arg 

155 " 160 

aat oat aca gaa aat tta agt. ?.~z gtt cgt get caa ttt ata get tta 528 
.\sr: Asp Thr Glu Asn Leu Ser VaJ Val Arg Ala Gin Phe He Ala Leu 

let i?C 175 



1 er depot 
18 



gac ctt gat ttt gtt aat get att cca ttg ttt gca gta aat gga cag 

Asp Lpu Asd Phe A/al Asn Ala He Pro Leu Phe Ala Val Asn Gly Gin 

180 185 190 

cag gtt cca tta ctg tea gta tat gca caa get gtg aat tta cat ttg 

Gin Val Pro Leu Leu 3er Val Tyr Ala Gin Ala Val Asn Leu His Leu 

~ ^ ^ •*! a r 



1 95 



200 



205 



576 



624 



tta tta tta aaa gat gca tct ctt ttt gga gaa gga tgg gga ttc aca 
Leu Leu Leu Lys Asp Ala Ser Leu Phe Gly Glu Gly Trp Gly Phe Thr 
210 215 220 



672 



cag ggg gaa att tec aca tat tat gac cgt caa ttg gaa eta acc get 
Gin Gly Glu He Ser Thr Tyr Tyr Asp Arg Gin Leu Glu Leu Thr Ala 



225 



230 



235 



240 



720 



aag tac act aat tac tgt gaa act tgg tat aat aca ggt tta gat cgt 
Lys Tyr Thr Asn Tyr Cys Glu Thr Trp Tyr Asn Thr Gly Leu Asp Arg 

245 250 255 



768 



tta aga gga aca aat act gaa agt tgg tta aga tat cat caa ttc cgt 
Leu Arg Gly Thr Asn Thr Glu Ser Trp Leu Arg Tyr His Gin Phe Arg 

260 265 270 



816 



aga gaa atg act tta gtg tfta tta gat gtt gtg gcg eta ttt cca tat 
Arg Glu Met Thr Leu Val 'Val Leu Asp Val Val Ala Leu Phe Pro Tyr 
275 280 285 



tat gat gta cga ctt tat ,cca acg gga tea- aac cca cag ctt aca cgt 

Tyr Asp Val Arg Leu Tyr Pro Thr Gly Ser Asn Pro Gin Leu Thr Arg 

290 '2 95 300 

gag gta tat aca gat ccg Utt gta ttt aat cca cca get aat gtt gga 

Glu Val Tyr Thr Asp Pro "lie Val Phe Asn Pro Pro Ala Asn Val Gly 

305 ' " 310 ■ 315 320 



864 



912 



960 



ctt tgc cga cgt tgg ggt act aat ccc tat aat act ttt tct gag etc 
Leu Cys Arg Arg Trp Gly Thr Asn Pro Tyr Asn Thr Phe Ser Glu Leu 

325 330 335 



1008 



gaa aat gee ttc att cgc cca cca cat ctt ttt gat agg ctg aat age 
Glu Asn Ala Phe lie Arg Pro Pro His Leu Phe Asp Arg Leu- Asn Ser 

340 345 350 



1056 



tta aca ate age agt aat cga ttt cca gtt tea tct aat ttt atg gat 
Leu Thr lie Ser Ser Asn Arg Phe Pro Val Ser Ser Asn Phe Met Asp 



o c. c 



360 



365 



1104 



tat tgg tea cga cat acg tta cgc cgt agt tat ctg aac qat 
Tyr Trc Ser Glv His Thr Leu Arc Aro Ser Tyr Leu Asn Asp 

37 5 380 



tea gca 
Ser Ala 



1152 



r S r. gat agt cat ggc 

!r. "J]'- Asp Ser Tyr Gly 

390 



eta att aca acc aca aga oca aca att 
Leu lie Thr Thr Thr Arg Ala T:.r He 

395 



4 0 0 



12 00 



oat gga aca aac cgc at a gag tea ac:: gta gat 

Asp Gly Thr Asn Arg He Glu Ser Thr Ala Val Asp 
4C5 410 4 15 



1 er depot 
19 



tf. cgt tct gca t t* c ar.9 ggt -r:a tat ggc gtg aat aga get ic*. 
Ph* Arg Ser Ala Leu lie Gly Tie Tyr Gly Val Asn Arc Ala Ser 



4 20 - 



425 



; i -> -> 



oLc cca cjgs gee t to ttt aat ggt acq act tct cct get aat gga cga 
Val Pro G'.y Gly Leu Phe Asn Gly Thr Thr Ser Pre Ala Asn Gly Gly 



4 > V 



4 40 



445 



1 3 4 4 



t gt aga gar etc tal cat aca aat gat gaa tta cca cca gat gaa act 
C y s A r g As p Le u T y r A s p Thr Asn Asp G 1 u Leu Pro Pro As p G 3 u Ser 



/ c: 
^ ^) U 



4 5 5 



460 



1392 



acc gga act t.-a acc cat ana eta tct cat gt t acc ttt ttt age ttt 



Thr G! 
A 6 5 



Thr Hi 



4 7 0 



Arc Leu Ser His Val Thr Phe Phe Ser Phe 



475 



4 80 



1440 



caa act aat cag get gga tct ata get aat gca gga agt gta ect act 
Gin Thr Asn Gin Ala Gly Ser He Ala Asn Ala Gly Ser Val Pro Thr 



485 



490 



495 



14 93 



tat gtt tgg acc cgt cgt gat gtg gac ctt aat aat acg att acc cca 
Tyr Val Trp Thr Arg Arg Asp Val Asp Leu Asn Asn Thr He Thr Pro 



500 



505 



510 



1536 



515 



520 



525 



eg 



aat aga att aca caa tta cca ttg gta aag gca tct gca cct gtt tc 
Asn Arg He Thr Gin Leu Pro Leu Val Lys Ala Ser Ala Pro Val Ser 



1584 



ggt act acg gtc tta aaa ggt cca gga ttt aca 'gga ggg ggt ata etc 
Gly Thr Thr Val Leu Lys Gly Pro Gly Phe Thr Gly Gly Gly He Leu 



530 



535 



540 



1632 



cga aga aca act aat ggc aca ttt gga acg tta aga gta acg gtt aat 
Arg Arg Thr Thr Asn Gly Thr Phe Gly Thr Leu Arg Val Thr Val Asn 



545 



5 50 



555 



560 



1680 



tea cca tta aca caa caa tat cgc eta aga gtt cgt ttt gec tea aca 
Ser Pro Leu Thr Gin Gin Tyr Arg Leu Arg Val Arg Phe Ala Ser Thr 



565 



570 



575 



1728 



gga aat tie agt ata agg g*_a etc cgt gga ggg gtt tct ate ggt gat 
Gly Asn Phe So:; lie Arg Val Leu Arg Gly Gly Val Ser Tie Gly Asp 



coo 



585 



590 



1 7 7 i 



a 1 1 a ;:a tta coo 



gc aca at g aac aga ggg cag gaa eta act tac gcia 
Val Arg Lej Gly Ser Thr Met Asn Arg Gly Gin Glu Leu Thr Tyr Glu 



600 



605 



1:0.5 

X c 1 



tec ttt tt;- aca aca aac ttt act act act ggt ccg t tc aat ccg cct 
:*-'fjr r:K: Ph-.; Thr Ar; Glu Phe Thr Thr Thr Gly Pro Phe Asn Pro Pre 



620 



1S72 



"oj qct 
■In Ala 



6;C 



nag att era aea gtg aat; -jca 
Zl'j Tie Leu Thr Val Asn A 1 ^ 

63 5 



:: a a 



g^ * 
G J \ 
»: <" 



t iot c a 



gat a;a att 



J r 



I e Asp Arc 11" 31m LI- 
650 



. a : 
6 5? 



1 ^tS 



c j a c i : 



a a gag gat tta 



caa c;jo nee a an aaa 



z r 



1er depot 



20 



Val Asn Pro Ala Arg Glu Ala Glu Glu Asp Leu Glu Ala Ala Lys Lys 

660 665 670 

gcg " 2019 

Ala 



<210> 8 
<211> 673 
<2 1 2 > PRT 

<213> Sequence artificielle 

<223> Description de la sequence artificielle: CryQCal Glu-164 
<A00> 8 

Mel" Asn Arg Asn Asn Gin Asn Glu Tyr Glu lie lie Asp Ala Pro His 
15 10 15 

Cvs GJy Cys Pro Ser Aso Asp Asp Val Arg Tyr Pro Leu Ala Ser Asp 

20 25 30 

i 

Pro Asn Ala Ala Leu Gin ?Asn Met Asn Tyr Lys Asp Tyr Leu Gin Met 
35 ; 40 45 

Thr Asp Glu Asp Tyr Thr Asp Ser Tyr He Asn Pro Ser Leu Ser He 

50 '■ 55 60 

Ser Gly Arg Asp Ala Val ; Gln Thr Ala Leu Thr Val Val Gly Arg He 
65 70 j 75 80 

Leu Gly Ala Leu Gly Val^Pro Phe Ser Gly Gin. He Val Ser Phe Tyr 

85 90 95 

Gin Phe Leu Leu Asn Thr jLeu Trp Pro Val Asn Asp Thr Ala He Trp 

100 105 HO 

Glu Ala Phe Met Arg Gin Val Glu Glu Leu Val Asn Gin Gin He Thr 

115 ! 120 125 

I 

Glu Phe Ala Arg Asn Gin Ala Leu Ala Arg Leu Gin Gly Leu Gly Asp 
130 135 140 

Ser Phe Asn Val Tyr Gin Arg Ser Leu Gin Asn Trp Leu Ala Asp Arg 

150 • 155 160 

Asn Asp Thr Glu Asn Leu Ser Val Val Arg Ala Gin Phe lie Ala Leu 

165 170 175 

Asp Leu Asp Phe Val Asn Ala He Pro Leu Phe Ala Val Asn Gly Gin 

180 185 190 



Pro Leu Leu Ser Val Tyr Ala Gin Ala Val Asn Leu His Leu 
195 200 205 



i 



eu Leu Lys Asp Ala Ser Leu Phe Gly Glu Gly Trp Gly Phe Thr 



"! i P " - : = , ? •? n 



:-lv Glu Tie Ser Thr Tvr Tvr Asp Arg Gin Leu G*. j Leu Thr Ala 

35 240 



I. vp Tvr Thr Asn Tyr Cvs Glu Thr Trp Tyr Asn Thr Gly Leu Asp Arg 

24 5 250 255 



1er depot 



21 



Lou Arg Gly Thr 

260 

Arg Glu Met Thr 
275 

Tyr Asp Val Arg 
290 

Glu Val Tyr Thr 

305 

Leu Cys Arg Arg 



Glu Asn Ala Phe 

340 

Leu Thr lie Ser 
355 

Tyr Trp Ser Gly 
370 

Val Gin Glu Asp 

385 

Asn Pro Gly Val 



Phe Arg Ser Ala 

420 

Val Pro Gly Gly 
435 

Cys Arg Asp Leu 
450 

Thr Gly Ser Ser 
465 

Gin Thr Asn Gin 



Tyr Val Trp Thr 

5 00 

Asn Arg lie Thr 
515 

01 v Thr Thr Val 



Ar?: Arg Thr Thr 



5 i I-rc Leu Thr 



Asn Thr Glu Ser 



Leu Val Val Leu 

280 

Leu Tyr Pro Thr 
295 

Asp Pro lie Val 
310 

Trp Gly Thr Asn 
325 

lie Arg Pro Pro 



Ser Asn Arg Phe 

360 

His Thr Leu Arg 
375 

Ser Tyr Gly Leu 
390 

Asp Gly Thr Asn 
405 

Leu lie Gly lie 



Leu Phe Asn Gly 

440 

Tyr Asp Thr Asn 
455 

Thr His Arg Leu 
470 

Ala Gly Ser lie 
485 

Arg Arg Asp Val 



Gin Leu Pro Leu 

520 

Leu Lys Gly Pro 
535 

Asn Gly Thr Phe 
550 

Gin Gin Tyr Arci 
5 65 



Trp Leu Arg Tyr 
265 

Asp Val Val Ala 



Gly Ser Asn Pro 

300 

Phe Asn Pro Pro 
315 

Pro Tyr Asn Thr 
330 

His Leu Phe Asp 
345 

Pro Val Ser Ser 



Arg Ser Tyr Leu 

380 

lie Thr Thr Thr 



Arg lie Glu Ser 
410 

Tyr Gly Val Asn 
425 

Thr Thr Ser Pro 



Asp Glu Leu Pro 

460 

Ser His Val Thr 
475 

Ala Asn Ala Gly 
490 

Asp Leu Asn Asn 
505 

Val Lys Ala Ser 



Gly Phe Thr Gly 

540 

Gly Thr Leu Arg 
555 

Leu Arg Val Arg 
57 0 



His Gin Phe Arg 
270 

Leu Phe Pro Tyr 
285 

Gin Leu Thr Arg 



Ala Asn Val Gly 

320 

Phe Ser Glu Leu 
335 

Arg Leu Asn Ser 
350 

Asn Phe Met Asp 
365 

Asn Asp Ser Ala 



Arg Ala Thr lie 

400 

Thr Ala Val Asp 
415 

Arg Ala Ser Phe 
4 30 

Ala Asn Gly Gly 
445 

Pro Asp Glu Ser 



Phe Phe Ser Phe 

480 

Ser Val Pro Thr 
495 

Thr He Thr Pro 
510 

Ala Pro Val Ser 
525 

Gly Gly lie Leu 



Val Thr Val Asn 

560 

Phe Ala Ser Thr 
575 



Gly Asn Phe Ser 

580 

Val Arg Leu Gly 
595 

Ser Phe Phe Thr 
610 

Phe Thr Phe Thr 
625 

Val Ser Thr Gly 



Val Asn Pro Ala 

660 



Ala 



He Arg Val Leu 



Ser Thr Met Asn 

600 

Arg Glu Phe Thr 
615 

Gin Ala Gin Glu 
630 

Gly Glu Tyr Tyr 
645 

Arg Glu Ala Glu 



1er depot 
22 



Arg Gly Gly Val 
535 

Arg Gly Gin Glu 



Thr Thr Gly Pro 

620 

Tie Leu Thr Val 
635 

He Asp Arg He 
650 

Glu Asp Leu Glu 
665 



Ser He Gly Asp 
590 

Leu Thr Tyr Glu 
605 

Phe Asn Pro Pro 



Asn Ala Glu Gly 

640 

Glu He Val Pro 
655 

Ala Ala Lys Lys 
670 



<210> 9 
<211> 2019 

<212> ADN . 
<213> Sequence artif icielle 

4 

<220> 

<223> Description de la sjequence artif icielle : Cry9Cal-100% 
<220> 

<221> CDS ■ 
<222> (1) . . (2019) 

<400> 9 

atg aat cga aat aat caa aat gaa tat gaa att att gaa gcc ccc cat 

Met Asn Arg Asn Asn Gin Hsn Glu Tyr Glu lie He Glu Ala Pro His 

1 5 ' 10 15 

tgt ggg tgt cca tea gaa gaa gaa tta agg tat cct ttg gca agt gaa 
Cys Gly Cys Pro Ser Glu Glu Glu Leu Arg Tyr Pro Leu Ala Ser Glu 

20 25 30 

cca aat gca gcg tta caa aat atg aac tat aaa gaa tac tta caa atg 
Pro Asn Ala Ala Leu Gin Asn Met Asn Tyr Lys Glu Tyr Leu Gin Met 

35 4 C 4 5 

aca gaa gag gaa tac act gaa tct tat ata aat cct agt tta tct att 
Thr Glu Glu Giu Tyr Thr Glu Ser Tyr He Asn Pro Ser Leu Ser He 

50 b Lr- 60 

aqr go- aqa gaa gca tta cai gcc ctt act qtt att agg aga ata 

Ser Glv Arc Giu Ala Leu G.l:.- Tr. :■ Ala Leu Thr Val He Arg Arg He 
t " 70 75 80 



48 



96 



144 



192 



24 0 



:cc cct tta agt t:-: c.r.-z ' t ; tct gga caa ata zta act ttt tat 
om Glv Ala Leu Glv Leu Vv ;. i-hc Ser Gly Gin He Leu Ser Phe Tyr 

35 9C 95 



cua ttc ctt tta aat aca cr c 11^ cca tta aat gaa aca get ata ttt 33b 



1er depot 



23 



Gin Phe Leu 



gaa get ttc 
Glu Ala Phe 
115 

gaa ttt qca 
Giu Phe Ala 
130 

tct ttt a a t 
Ser Phe Asn 
145 

aat gaa aca 
Asn Glu Thr 



gaa ctt gaa 
Glu Leu Glu 



cag tta cca 
Gin Leu Pro 
195 

tta tta tta 
Leu Leu Leu 
210 

cag ggg gaa 
Gin Gly Glu 
225 

aag tac act 
Lys Tyr Thr 



tta aga gga 
Leu Arg Gly 



aga gaa atg 

Arg Giu Met 
27 5 

tat gaa tta 

Tyr Glu Leu 

290 

gag t t a Kaz 

3' -j I c.u Tyr 
30b 

; r i to-: cq a 

1 -«'=•-*. Cys Arg 

:jr 3 . ^ ~ar. gec 

.11*.: Asn Ala 



Leu Asn Thr 
100 

atg cga cag 
Met Arg Gin 



aoa aat cao 
Arg Asn Gin 



tta tat caa 
Leu Tyr Gin 
150 

cga aat tta 
Arg Asn Leu 
165 

ttt tta aat 
Phe Leu Asn 
180 

tta ctg tea 
Leu Leu Ser 



aaa gaa gca 
Lys Glu Ala 



att tec aca 
lie Ser Thr 
230 

aat tac tgt 
Asn Tyr Cys 
245 

aca aat act 
Thr Asn Thr 
260 

act tta tta 
Thr Leu Leu 



cga ctt tat 
Arg Leu Tyr 



aca gaa c::o 

Thr Giu Pro 
310 

eg t ttt qr.\ 

Arg ?he Gly 
325 

ttc azz e 7 • : 

Fhe lie Ari 



Leu Phe Pro 
105 

tta gag gaa 
Leu Glu Glu 
120 

gca ctt gca 
Ala Leu Ala 
135 

cgt tec ctt 
Arg Ser Leu 

agt tta tta 
Ser Leu Leu 



get att cca 
Ala lie Pro 
185 

tta tat gca 
Leu Tyr Ala 
200 

tct ctt ttt 
Ser Leu Phe 
215 

tat tat gaa 
Tyr Tyr Glu 



gaa act ttt 
Giu Thr Phe 



gaa agt ttt 
Glu Ser Phe 
265 

tta tta gaa 
Leu Leu Glu 
290 

cca a eg gga 
Pro Thr Gly 

lie Leu Phe 



= ."t a a-; ccc 
T!.t Asn Pro 



r r 3 :ra cat 
Pro His 



Leu Asn Glu 



ctt tta aat 
Leu Leu Asn 



aga ttg caa 
Arg Leu Gin 
140 

caa aat ttt 
Gin Asn Phe 
155 

cgt get caa 
Arg Ala Gin 
170 

ttg ttt gca 
Leu Phe Ala 



caa get tta 
Gin Ala Leu 



gga gaa gga 
Gly Glu Gly 
220 

cgt caa ttg 
Arg Gin Leu 

235 ' 

tat aat aca 
Tyr Asn Thr 
250 

tta aga tat 
Leu Arg Tyr 

tta tta gcg 
Leu Leu Ala 



tea aac cca 
Ser Asn Pro 
300 

aat cca cca 
Asn Pro Pro 
315 

tat aat act 
Tyr Asn Thr 
330 

ctt ttt gaa 
Leu Phe Glu 



Thr Ala Tie 
110 

caa caa ata 
Gin Gin He 
125 

gga tta gga 
Gly Leu Gly 



ttg get gaa 
Leu Ala Glu 



ttt ata get 
Phe He Ala 
175 

tta aat gga 
Leu Asn Gly 
190 

aat tta cat 
Asn Leu His 
205 

ttt gga ttc 
Phe Gly Phe 



gaa eta ace 
Glu Leu Thr 



ggt tta gaa 
Gly Leu Glu 
255 

cat caa ttc 
His Gin Phe 
270 

eta ttt cca 
Leu Phe Pro 
285 

cag ctt aca 
Gin Leu Thr 



get aat tta 
Ala Asn Leu 



ttt tct gag 
Phe Ser Glu 
33 5 

age ctg aat 
Arc? Leu Asn 



Phe 



aca 334 
Thr 



gaa 432 
Glu 



cga 480 

Arg 

160 

tta 528 
Leu 



cag 576 
Gin 



ttg 624 
Leu 



aca 672 
Thr 



get 720 

Ala 

240 

cgt 768 
Arg 



cgt 816 
Arg 



tat 864 
Tyr 



cgt 912 
Arg 



gga 960 

Gly 

32 0 

etc 3CC8 
Leu 



age 1056 
Ser 
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340 



24 



34 5 350 



ct-a aca ate age -agt aat cga ttt cca tta tea tct aat r.tt atg gaa 1104 
Leu Thr He Ser Ser Asn Arg Phe Pro Leu Ser Ser Asn Phe Met Glu 
355 360 365 



tat ttt tea gga eat aeg tta egc cgt agt tat ctg aae gaa tea. gea ■ 

Tyr Phe Ser Gly His Thr Leu Arg Arg Ser Tyr Leu Asn Glu Ser A-la 
370 375 380 

tta caa gaa gaa agt tat gge eta att aca acc aca aga gea aca att 

Leu Gin Glu Glu Ser Tyr Gly Leu Tie Thr Thr Thr Arg Ala Thr He 

^ ^ ^ tqc; /inn 



acc gga agt tea acc cat aga eta tct cat tta acc ttt ttt age ttt 
Thr Gly Ser Ser Thr His Arg Leu Ser His Leu Thr Phe Phe Ser Phe 
465 470 475 480 

eaa act aat cag get gga tct ata get aat gea gga agt tta cct act 
Gin Thr Asn Gin Ala Gly Ser He Ala Asn Ala Gly Ser Leu Pro Thr 

485 490 495 

tat tta ttt acc cgt cgt gaa tta gaa ett aat aat acq att acc cca 
Tvr Leu Phe Thr Arg Arg Glu Leu Glu Leu Asn Asn Thr lie Thr Pro 

500 505 510 

aat aga att aca caa tta cca ttg tta aag gea tct gea cct tta teg 
Asn ^rg He Thr Gin Leu Pro Leu Leu Lys Ala Ser Ala Pro Leu Ser 
515 520 525 

-.i.:it act aeg tta tta aaa ggt cca gga ttt aca gga ggg ggt ata etc 
Gly Thr Thr Leu Leu Lvs Gly Pro Gly Phe Thr Gly Gly Gly lie Leu 
530 535 540 



- 1 . . 



1152 



1200 



1248 



1296 



aat ccc gga tta gaa gga aca aac cgc ata gag tea aeg gea tta gaa 

Asn Pro Gly Leu Glu Gly Thr Asn Arg He Glu Ser Thr Ala Leu Glu 

405 410 415 

ttt cgt tct gea ttg ata ggt ata tat ggc tta aat aga get tct ttt 

Phe Arg Ser Ala Leu He Gly He Tyr Gly Leu Asn Arg Ala Ser Phe 

420 425 430 

tta cca gga ggc ttg ttt aat ggt aeg act tct cct get aat gga gga 

Leu Pro Gly Gly Leu Phe Asn Gly Thr Thr Ser Pro Ala Asn Gly Gly 

435 440 44 5 

* 

tgt aga gaa etc tat gaa 5 aca aat gaa gaa tta cca cca gaa gaa agt 1392 

Cys Arg Glu Leu Tyr Glu Thr Asn Glu Glu Leu Pro Pro Glu Glu Ser 

4 50 4 55 4 60 



1344 



1440 



1488 



1536 



1584 



1632 



c-a aga aca act aat ggc aca ttt gga aeg tta aga tta acq tta aat 1680 

V-q '«-a Thr Thr Asn Glv Thr Phe Gly Thr Leu Arg Leu Thr Leu Asn 

V;;«:' " 550 555 560 

t c.-i CZ5 tta aca caa caa tat r eta aga tta cgt t"t -:cc tea aca 1*?28 

i- -ro Leu Thr Gin Gin Ty: A: } Leu Arg Leu Ar:j f*h- Ala Ser Thr 

565 570 57 5 



aa\ ttc agt :*ta agq eta -.:t: cgt gga ggg tta ret ate ggt gaa 1776 
Asn Phe Ser He Arg Leu Leu Arg Gly Gly Leu Ser Tie Gly Glu 
530 585 ^90 



1er depot 



25 



t::.a aga tta ggg age aca acg aac aga ggg cag gaa eta acn tac gaa 
Leu Arg Leu Gly^er Thr Met Asn Arg Glv Gin Glu Leu Thr Tyr Glu 
595 600 605 



1324 



tec ttt ttc aca aga gag ttt act act act ggt ccg ttc aat ccg cct 
Ser Phe Phe Thr Arg Glu Phe Thr Thr Thr Gly Pro Phe Asn Pro Pro 
610 615 620 



1372 



ttt aca ttt aca caa get caa gag att eta aca tta aat gca gaa ggt 
Phe Thr Phe Thr Gin Ala Gin Glu He Leu Thr Leu Asn Ala Glu Gly 
625 630 635 640 



1920 



tta age ace ggt qgt gaa tat tat ata gaa aga att gaa att tta cct 
Leu Ser Thr Gly Gly Glu Tyr Tyr He Glu Arg He Glu He Leu Pro 

645 650 655 



1968 



tta aat ccg gca ega gaa gcg gaa gag gaa tta gaa gcg gcg aag aaa 
Leu Asn Pro Ala Arg Glu Ala Glu Glu Glu Leu Glu Ala Ala Lys Lys 

660 665 670 



2016 



gcg 
Ala 



2019 



<210> 10 
<211> 673 
<212> PRT 
<213> Sequence 
<223> Description de la sequence art i f iciel le : 



Cry9Cal-100% 



<400> 10 

Met Asn Arg Asn Asn Gin Asn Glu Tyr Glu He He Glu Ala Pro His 

10 15 



1 



5 



Cys Gly Cys Pro Ser Glu Glu Glu Leu Arg Tyr Pro Leu Ala Ser Glu 

20 25 30 

Pro Asn Ala Ala Leu Gin Asn Met Asn Tyr Lys Glu Tyr Leu Gin Met 

40 45 



35 



Thr Glu Glu Gin Tyr Thr Glu Ser Tyr He Asn Pro Ser Leu Ser He 
50 55 60 

Ser Gly Arg Glu Ala Leu Gin Thr Ala Leu Thr Val He Arg Arg lie 
" 70 75 80 

Leu Gly Ala Leu Gly Leu Pro Phe Ser Gly Gin He Leu Ser Phe Tyr 

85 9C 95 

Glr. Phe Leu Leu Asn Thr Leu Phe Pro Leu Asn Glu Thr Ala He Phe 

100 105 HQ 



l\: Ala Phe r-joi Arg Gin Leu Glu Glu Leu Leu 
- r- 
r> 



Asn G.Irs Gin He Thr 
125 



Ik y}-.i-. Ala Arg Asn Gin Ala Leu Ala Arc L 



eu Gin Gly Leu Gly Glu 
14 0 



; Asn leu Tyr Gin Arc Ser Leu Gin Asn ?he Leu Ai 



15C 



155 



H.ia o^u Mrg 
160 



1er depot 



26 



i.*- Glu Thr Arg Asn Leu Ser Lou Lou Arg Ala Gin Phe He Ala Leu 

-16b 170 175 

Glu Leu Glu Phe Leu Asn Ala lie Pro Leu Phe Ala Leu Asn Gly Gin 

180 185 i9 ° 

Gin Leu Pro Leu Leu Ser Leu Tyr Ala Gin Ala Leu Asn Leu His Leu 
195 200 205 

Lou Lou Leu Lys Glu Ala Ser Leu Phe Gly Glu Gly Phe Gly Phe Thr 
22 0 215 220 

G^n GLy Glu Tie Ser Thr Tyr Tyr Glu Arg Gin Leu Glu Leu Thr Ala 
22:. 230 235 240 

Lys Tyr Thr Asn Tyr Cys Glu Thr Phe Tyr Asn Thr Gly Leu Glu Arg 

245 250 255 

I.ou Arg Gly Thr Asn Thr Glu Ser Phe Leu Arg Tyr His Gin Phe Arg 

260 265 270 

Arg Glu Met Thr Leu Leu Leu Leu Glu Leu Leu Ala Leu Phe Pro Tyr 
275 280 285 

Tyr Glu Leu Arg Leu Tyr Pro Thr Gly Ser Asn Pro Gin Leu Thr Arg 
290 295 300 

Glu Leu Tyr Thr Glu Pro lie Leu Phe Asn Pro Pro Ala Asn Leu Gly 
305 310 »■ ' 315 320 

Leu Cys Arg Arg Phe Gly Th'r Asn Pro Tyr Asn Thr Phe Ser Glu Leu 

325 330 335 

Glu Asn Ala Phe He Arg Pro Pro His Leu Phe Glu Arg Leu Asn Ser 

340 ' 345 350 

Leu Thr He Ser Ser Asn Arg Phe Pro Leu Ser Ser Asn Phe Met Glu 

355 " 360 365 

Tyi Phe Ser Gly His Thr Leu Arg Arg Ser Tyr Leu Asn Glu Ser Ala 
370 375 ~ 380 

Leu 'Jin Glu Glu Ser Tyr Gly Leu He Thr Thr Thr Arg Ala Thr He 
j.j?5 390 395 4 00 

Asr: Pro Gly Leu Glu Gly Thr Asn Arg He Glu Ser Thr Ala Leu Glu 

405 410 415 

Phe Arc: Ser Ala Leu He Gly lie Tyr Gly Leu Asn Arg Ala Ser Phe 

4 20 4 25 4 33 

I ~ : ■ r Gly Gly Leu Phe Asn " : y Thr Thr Ser Pro Al«» Asn Gly Gly 

.1 " 44 ?■ 



.:• i ■■*•;»! Lev: Tyr Glu Th: Asn Glu Glu Leu Pre? : J r: Slu Glu Ser 
1 • \ 4 5 4 o C 

H ~or Ser Thr Hi.s Aru leu Ser His Leu Thr Phe Phe Ser Phe 

470 475 480 



1er depot 



27 



GJn Thr Asn Gin 



Tyr Lou Phe Thr 

500 

Asn Ar«,j lie Thr 

O/ Thr Thr Lei: 
* 20 

Arq Arg Thr Thr 
c 4 

Ser Pro Leu Thr 



Gly Asn Phe Ser 

580 

Leu Arq Leu Gly 
595 

Ser Phe Phe Thr 
610 

Phe Thr Phe Thr 

625 

Leu Ser Thr Gly 



Leu Asn Pro Ala 

660 

Ala 



Ala Gly Ser Tie 
465 

Arg Arg Glu Leu 



Gin Leu Pro Leu 

520 

Leu Lys Gly Pro 
535 

Asn Gly Thr Phe 
550 

Gin Gin Tyr Arg 

565 

lie Arg Leu Leu 



Ser Thr Met Asn 

600 

Arg Glu Phe Thr 
615 

Gin Ala Gin Glu 
630 

Gly Glu Tyr Tyr 
645 

Arg Glu Ala Glu 



Ala Asn Ala Gly 
490 

Glu Leu Asn Asn 
505 

Leu Lys Ala Ser 



Gly Phe Thr Gly 

540 

Gly Thr Leu Arg 
555 

Leu Arg Leu Arg 
570 

Arg Gly Gly Leu 
585 

Arg Gly Gin Glu 



Thr Thr Gly Pro 

620 

lie Leu Thr Leu 
635 

lie Glu Arg lie 
650 

Glu Glu Leu Glu 
665 



Ser Leu Pro Thr 
495 

Thr lie Thr Pro 
510 

Ala Pro Leu Ser 
525 

Gly Gly lie Leu 



Leu Thr Leu Asn 

560 

Phe Ala Ser Thr 
575 

Ser lie Gly Glu 
590 

Leu Thr Tyr Glu 
605 

Phe Asn Pro Pro 



Asn Ala Glu Gly 

640 

Glu lie Leu Pro 
655 

Ala Ala Lys Lys 
67 0 



O10> 11 

<211> 2019 

<212> ADN 

<21.S> Sequence artificielle 

<22C> 

<22?> Description de la sequence artificielle: Cry9Cal-25% 

v' ~ O " ' - p c; 

^- — — •— — , . - \ c V .L I 



'■ -^ga aat aat caa aat caa tat gaa alt alt gat :-cc ccc cat 

- r. Ar'.: Asn Asn Gin Asn Glu Tyr Glu lie He Asc Ala Pro His 

5 10 15 

t-jr -j p zg~ cca tea gat cac cat gtg agg tat cct ttq gca agt gac 

lys ^ - V Cys Pro Ser Asp Asp Asp Vai Arg Tyr Pre Leu Ala Ser Asc 

20 25 30 



1er depot 
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cca aat gca gcg tta caa aat atg aac tat aaa gat tac tta caa atg 14 4 

Pro Asn Ala Ala *Leu Gin Asn >5et Asn Tyr Lys Asp Tyr Leu Gin Met 

35 4 0 4 5 

aca gat gag gac tac act gat tct tat ata aat cct agt tta tct att 102 

Thr Asp Glu Asp Tyr Thr Asp Ser: Tyr lie Asn Pro Ser Leu Ser He 

50 ' 55 ' 60 

agt ggt aga go a gca tta cag act gcg ctt a eg tta tta ggg aga ata 240 

Ser Gly Arg Glu Ala Leu G!r. Thr Ala Leu Thr Leu Leu Gly Arg He 

65 70 75 30 

etc ggg get tta ggt gtt ccg ttt tct gga caa ata tta agt ttt tat 283 

Leu Gly Ala Leu Gly Val Pro Phe Ser Gly Gin He Leu Ser Phe Tyr 

85 90 95 

caa ttc ctt tta aat aca ctg tgg cca gtt aat gat aca get ata tgg 336 

Gin Phe Leu Leu Asn Thr Leu Trp Pro Val Asn Asp Thr Ala He Trp 

100 105 110 

gaa get ttc atg cga cag gtg gag gaa ctt gtc aat caa caa ata aca 384 

Glu Ala Phe Met Arg Gin Val Glu Glu Leu Val Asn Gin Gin He Thr 

115 ' 120 125 

gaa ttt gca aga aat cag gca ctt gca aga ttg caa gga tta gga gaa 432 

Glu Phe Ala Arg Asn Gin Ala Leu Ala Arg Leu Gin Gly Leu Gly Glu 

130 135 140 

tct ttt aat gta tat caa egt tec ctt caa aat tgg ttg get gat cga 480 

Ser Phe Asn Val Tyr Gin Arg Ser Leu Gin Asn Trp Leu Ala Asp Arg 

145 150 155 160 

aat gat aca cga aat tta agt tta tta egt get caa ttt ata get tta 528 

Asn Asp Thr Arg Asn Leu Ser Leu Leu Arg Ala Gin Phe He Ala Leu 

165 170 175 

gac ctt gat ttt gtt aat get att cca ttg ttt gca gta aat gga cag 576 

Asp Leu Asp Phe Val Asn Ala He Pro Leu Phe Ala Val Asn Gly Gin 

.180 185 190 

cag gtt cca ti:a ctg tea gta tat gca caa get tta aat tta cat ttg 624 

Gin Val Pro Leu Leu Ser Val Tyr Ala Gin Ala Leu Asn Leu His Leu 

195 . 2C0 205 

tta tta tta aaa gaa gca tct ctt ttt gga gaa gga tgg gga ttc aca 672 

Leu Leu Leu Lys Glu Ala Ser Leu Phe Gly Glu Gly Trp Gly Phe Thr 

210 215 220 

cag ggg gaa att tec aca tat: tat gaa egt caa ttg gaa eta acc get 7 20 

Gin Gly Glu He Ser Thr Tyr Tyr Gin Arg Gin Leu Glu Leu Thr Ala 

225 230 235 240 

a^c. lac act ci a*, tac igt gaa nc'.: tgg tat aat aca ggt tta caa egt \'C : : 

Lys Tyr Thr Asn Tyr Cyr G ■ : T:\: Trp Tyr Asn Thr Gly Leu Giu Arg 



250 255 



-.I-: :ik\:a qgii .-at ac:\ go.-: : ;l *; t * tua aca tat cat caa zzc cgr : i o 

: eu Arc Gly Thr Asr. Thr Glc .-.:r Phe Leu Arg Tyr Hi s Gin Phe Arg 

260 265 270 
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29 



aca gaa atg act tua gtg gta I _ a gat gtt cig gcg eta ttt cca tat 
Aig Glu Met Thr Leu Val Vol :.eu Asp Vai Val Ala Leu Phe Pro Tyr 



275 



p r 



285 



>64 



t gat gta cga ctt tat cca acc gga tea aac cca cag ctt aca cgt 
/r Asp Val Arg Leu Tyr Pro Thr Gly Ser Asn Pro Gin Leu Thr Arg 



29C 



295 



30C 



912 



gag gta tat aca gat ccq a*. * gta ttt aat cca cca get aat tta gga 
Glu Val Tyr Thr Asp Prr: lie Val Phe Asn Pro Pro Ala Asn Leu Glv 
30b 310 315 320 



960 



etc t gc cga cgt tgg ggr ac: aat ccc tat aat act ttt tct gag etc 
Leu Cys Arg Arg Trp Giy Thr Asn Pro Tyr Asn Thr Phe Ser Glu Leu 

325 330 335 



1008 



gaa aat gee ttc att cgc cca cca cat ctt ztt gaa agg ctg aat age 
Glu Asn Ala Phe He Arg Pro Pro His Leu Phe Glu Arg Leu Asn Ser 

345 350 



340 



1056 



tta aca ate age agt aat cga ttt cca gtt tea tct aat ttt atg gaa 
Leu Thr He Ser Ser Asn Arq Phe Pro Val Ser Ser Asn Phe Met Glu 
355 360 : 365 



1104 



tan ttt tea gga cat acg tta cgc cgt agt tat ctg aac gat tea gca 
Tyr Phe Ser Gly His Thr Leu Arg Arg Ser Tyr Leu Asn Asp Ser Ala 
370 375 380 



1152 



gta caa gaa gat agt tat ggc eta att aca ace aca aga gca aca att 
Val Gin Glu Asp Ser Tyr Gly Leu He Thr Thr "Thr Arg Ala Thr He 
385 390 395 400 



1200 



aat ccc gga gtt gat gga aca aac cgc ata gag tea acg gca gta gat 
Asn Pro Gly Val Asp Gly Thr Asn Arg He Glu Ser Thr Ala Val Asp 

•105 410 415 



1248 



ttt cgt tct gca ttg ata ggt ata tat ggc gtg aat aga get tct ttt 
Phe Arg Ser Ala Leu He Gly He Tyr Gly Val Asn Arg Ala Ser Phe 

420 425 430 



1296 



gtc cca gga ggc ttg ttt- ,-ja*; ggt acg act tct cct get aat gga gga 
Val Pro Giy Gly Leu Phe A*n Gly Thr Thr Ser Pro Ala Asn Gly Gly 
4 35 440 445 



134 4 



tgt aga gat etc tat gat ana aat gat gaa tta cca cca gat gaa agt 



r> ys Arg Asp Leu Tyr Asp Thr Asn Asp Glu Leu Pro Pro Asp Glu Ser 



.1 c o 



- • 5 5 



4 60 



13 92 



acc gga agt t va ace cat aga era tct cat tta acc ttt ttt aac ttt 



Thr Gly Ser 
A 65 



Ser Thr His Arq Leu Ser His Leu Thr Phe Phe Ser Phe 



*3 



475 



4 80 



14 4 0 



■i C t D 3 \. 



: i . rj r **sr. 



a - ~ 



|— r — ~j r. 

. • t l w 4 



- :. c 
i ~ 



gta 



ir a get aat cca cga ag 
T:e Ala Asn Ala Gly Ser Val Pro Th 



4 90 



4 95 



4 33 



- F 



a i : c 
Thr 



cac ctt aat 



ode a . . 

V.-il Asp Leu Asr. As:: 'Y\\i 

v.* 



rvc at.-; acc cca 



:r ?ro 



•\ r 



l ttg gca aag qza tct gca ret gtt teg 



1er depot 
30 



Asr. Arg lie Thr Gin Leu Pre Lev; Vai Lys Ala Ser Ala Pro Val Ser 
515 520 525 



gqt act acg gtc tta aaa got cca gga ttt aca gga gag ggt ata etc 
Giy Thr Thr Val Leu Lys Gly Pro Gly Phe Thr Gly Gly Gly lie Leu 
520 535 540 



1632 



cga aga aca act aat ggc aca ttt gga acg tta aga -gta acg gtt aat 
Arg Arg Thr Thr Asn Gly Thr Phe Gly Thr Leu Arg Val Thr Val Asn 
545 550 555 560 



1680 



tea cca tta aca caa caa tat cgc eta aga tta cgt ttt :jcc tea aca 
Ser Pro Leu Thr Gin Gin Tyr Arg Leu Arg Leu Arg Phe Ala Ser Thr 

565 570 575 



1728 



gga aat ttc agt ata agg gta etc cgt' gga ggg gtt tct ate ggt gat 
Giy Asn Phe Ser lie Arg Val Leu Arg Gly Gly Val Ser lie Gly Asp 

580 585 590 



1776 



gtt aga tta ggg age aca atg aac aga ggg cag gaa eta act tac gaa 
Val Arg Leu Gly Ser Thr Met Asn Arg Gly Gin Glu Leu Thr Tyr Glu 
595 . 600 605 



1824 



tec ttt ttc aca aga gag -ttt act act act ggt ccg ttc aat ccg cct 
Ser Phe Phe Thr Arg Glu Phe Thr Thr Thr Gly Pro Phe Asn Pro Pro 
610 *615 620 



1872 



ttt aca ttt aca caa get. caa gag att eta aca gtg aat gca gaa ggt 
Phe Thr Phe Thr Gin Ala 'Gin Glu lie Leu Thr Val Asn Ala Glu Gly 
625 630 ■; 635 640 



1920 



gtt age ace ggt ggt gaa' tat tat ata gat aga att gaa att gtc cct 
Val Ser Thr Gly Gly Glu Tyr Tyr lie Asp Arg He Glu He Val Pro 

645 ' 650 655 



1968 



gtg aat ccg gca cga gaa 'gcg gaa gag gat tta gaa gcg gcg aag aaa 
Val Asn Pro Ala Arg Glu' Ala Glu Glu Asp Leu Glu Ala Ala Lys Lys 

660 665 670 ■ 



2016 



gcg 
Ala 



2019 



<210> 12 
<21)> 67 3 
<212> PRT 



-"21 2> Sequence artificielle 

< 2 2 3 > Description de la sequence artificielle: 



rv9Cal-25% 



... z 



<400. 

Xe-t Asn Are Asn Asr: Gin Asr. 
1 



Glu Tyr Glu lie He Asp Ala Pro His 
10 15 



r,y Cys Pre Ser Asp Asp Asp Vai Arg Tyr Pro Leu Ala Ser Asp 



:• .* A.-.ti A" a Ala Leu Gin Asr Ke Asr. Tyr Lvs Asr 



■ ■ * , *- * ■ 

.] = 



In Mc T : 



) * f A .op Glu Asp 
50 



Tyr Thr Asp Ser Tyr He Asr. Pro Ser Leu Ser He 
5 5 60 
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31 



Ser Gly Arg Glu 

6 •". 

Leu Gly Ala Leu 



Gin Phe Leu Leu 

100 

Giu Ala Phe Met 
115 

Glu Phe Ala Arg 
130 

Ser Phe Asn Val 
14 5 

Asn Asp Thr Arg 



Asp Leu Asp Phe 

180 

Gin Val Pro Leu 
195 

Leu Leu Leu Lys 
210 

Gin Gly Glu lie 

225 

Lys Tyr Thr Asn 



Leu Arg Gly Thr 

260 

Arg Glu Met Thr 

275 

Tyr Asp Val Arg 
290 

Glu Val Tyr Thr 
Leu Cys Arg Arg 



rr.o Ser Gly 
?7C 



Ala Leu Gin Thr 
70 

Gly Val Pro Phe 
85 

Asn Thr Leu Trp 



Arg Gin Val Glu 

120 

Asn Gin Ala Leu 
135 

Tyr Gin Arg Ser 
150 

Asn Leu Ser Leu 
165 

Val Asn Ala lie 



Leu Ser Val Tyr 

200 

Glu Ala Ser Leu 
215 

Ser Thr Tyr Tyr 
230 

Tyr Cys Glu Thr 
245 

Asn Thr Glu Ser 



Leu Val Val Leu 

280 

Leu Tyr Pro Thr 
295 

Asp Pro lie Val 
310 

Trp Gly Thr Asn 
± 5 

_ 1 e A r c ? rc« ? r c 



Ser Asn Arg Phe 

C r 
.} C ^ 

•lis Thr Lou Arc 



Ala Leu Thr Leu 
75 

Ser Gly Gin He 
90 

Pro Val Asn Asp 
105 

Glu Leu Val Asn 



Ala Arg Leu Gin 

140 

Leu Gin Asn Trp 
155 

Leu Arg Ala Gin 
170 

Pro Leu Phe Ala 
185 

Ala Gin Ala Leu 



Phe Gly Glu Gly 

220 

Glu Arg Gin Leu 

235 

Trp Tyr Asn Thr 
250 

Phe Leu Arg Tyr 
265 

Asp Val Val Ala 



Gly Ser Asn Pro 

300 

Phe Asn Pre Pro 
315 

Pro Tyr Asn Thr 
330 

His Leu Phe Glu 
34 5 

Pro Val Ser Ser 



Arg Ser Tyr Leu 

3 O ^> 



Leu Gly Arg lie 

80 

Leu Ser Phe Tyr 
95 

Thr Ala He Trp 
110 

Gin Gin He Thr 

125 

Gly Leu Gly Glu 



Leu Ala Asp Arg 

160 

Phe He Ala Leu 
175 

Val Asn Gly Gin 
190 

Asn Leu His Leu 
205 

Trp Gly Phe Thr 



Glu Leu Thr Ala 

240 

Gly Leu Glu Arg 
255 

His Gin Phe Arg 
270 

Leu Phe Pro Tyr 

285 

Gin Leu Thr Arg 



Ala Asn Leu Gly 

320 

Phe Ser Glu Leu 
335 

Arg Leu Asn Ser 
350 

Asn Phe Met Giu 
365 

Asn Asp Ser Ala 
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Val Gin Glu Asp Ser Tyr Gly Leu lie Thr Thr Thr Arg Ala Thr lie 
335 390 395 400 

Asn Pro Gly Val Asp Gly Thr Asn Arg lie Glu Ser Thr Ala Val Asp 

405 410 415 

Phe Arg .Ser Ala Leu lie Gly lie Tyr Gly Val Asn Arg Ala Ser Phe 

420 425 430 

i 

Val Pro Gly Gly Leu Phe Asn Gly Thr Thr Ser Pro Ala Asn Gly Gly 
435 440 445 

Cys Arg Asp Leu Tyr Asp Thr Asn Asp Glu Leu Pro Pro Asp Glu Ser 
450 455 460 

Thr Gly Ser Ser Thr His Arg Leu Ser His Leu Thr Phe Phe Ser Phe 
465 470 475 480 

Gin Thr Asn Gin Ala Gly Ser lie Ala Asn Ala Gly Ser Val Pro Thr 

485 490 495 

»■ 

Tyr Val Trp Thr Arg Arg Asp Val Asp Leu Asn Asn Thr lie Thr Pro 

500 505 510 

Asn Arg lie Thr Gin Leu Pro Leu Val Lys Ala Ser Ala Pro Val Ser 
515 . 520 525 

■ i 

i 

Gly Thr Thr Val Leu Lys -Gly Pro Gly Phe Thr Gly Gly Gly lie Leu 
530 . 535 540 

* * 

Arg Arg Thr Thr Asn Gly *Thr Phe Gly Thr Leu Arg Val Thr Val Asn 
545 550 555 560 

Ser Pro Leu Thr Gin Gin 'Tyr Arg Leu Arg Leu Arg Phe Ala Ser Thr 

565 1 570 575 

Gly Asn Phe Ser lie Arg' Val Leu Arg Gly Gly Val Ser lie Gly Asp 

580 585 590 

Val Arg Leu Gly Ser Thr Met Asn Arg Gly Gin Glu Leu Thr Tyr Glu 
595 600 605 

Ser Phe Phe Thr Arg Glu Phe Thr Thr Thr Gly Pro Phe Asn Pro Pro 
610 615 620 

Phe Thr Phe Thr Gin Ala Gin Glu He Leu Thr Val Asn Ala Glu Gly 
625 630 635 640 

Val Ser Thr Gly Gly Glu Tyr Tyr He Asp Arg He Glu He Val Pro 

645 650 655 

Val Asn Pro Ala Arg Glu Ala Glu Glu Asp Leu Glu Ala Ala Lys Lys 

660 665 670 
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M 



ADN 

" 2 I 2 > Seque nee a r t i f i c ie 1 1 1 
<?2C> 

<22 3> Description de la s-yjuorce artificielle: mutant 1 



< 4 C 0 > 3 

qaa 1 1 a a a t c; a a \ I L t z a a a r 



t r. « a g 1". g t t 



30 



0> 14 



■r::i:> 30 

<2:2> ADN 



' /L - s. > Sequence a r :.c:el \ e 



- ^ V.' ^ 



223> Description de la sequence arti f icieile : mutant 2 
<400> 14 

gaattaaatg aattattaaa tttaagtgtt 30 

<210> 15 
<211> 30 
<212> ADM 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: mutant 3 
<400> 15 

gaattattag aatttttatt attaagtgtt 30 



<2I0> 16 
<211> 30 
< 2 1 2 > ADN 

<2j3> Sequence artificielle 
<22C:> 

<-223> Description de la soouence artificielle: mutant 4 



<400> 16 

gaattattag aattattatt a 1 1 a a o *_ a L t 



30 



<210> 
<2il> 



17 
30 
ADN 

Sequence 



ar:it: c 1 e ... 1 e 



':.2:> Des.~ripl : rn : ■:. .~o:: re artificielle: mutant 5 



-. *■ 



3 q 



a"tv:tt 



3 
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<213> Sequence arti f icielle 

<220> 

<223> Description de la sequence artificielle 
<40C> 18 

gaacqattag aatt tttatt attaagtgtt 



<23.0> 19 
<211> 30 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle 

i 

<400> 19 

gaacgattag aattattatt attaagtgtt 



<210> 20 j 
<211> 30 

<212> ADN .* 

<213> Sequence artificielle' 



<220> 

<223> Description de la sequence artificielle 

<400> 20 '] 
gaattagaag aattattatt attaagtgtt 

- i 
\ 

<210> 21 ! 
<211> 30 I 
<212> ADN | 
<213> Sequence artificielle; 

<220> 

<223> Description de la sequence artificielle 
<4 0C> 21 

gaattattag aagaagaaga attaagtgtt. 



<210> 22 
<211> 33 
<212> ADN 

<213> Sequence artificielle 



<220> 

<22?> Description de la scquonro art if icie] 

• * r> r r ) " 

:tr.:tactcj altiaUttt ttit.ac.-V \ « c t z 



e 



:> 33 



<2-^> .h-^N 

<213-* jeouen^o artificielle 
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<220> 

<;.23> Description cle la sequence artificielle: mutantll 

<-;oo> 2 3 

tttttattaa atttagaaga attaccatta ctg 

<210> 24 
<211> 33 
<212> ADN 

<213> Sequence artificielle 
<220^ 

<223> Description de la sequence art i f ici el le : mutant 12 
<400> 24 

tttgaagaaa atttagaaga attaccatta ctg 

<210> 2 5 
<211> 33 
<212> ADN 

<213> Sequence ar ti f icielle 
<220> 

<223> Description de la sequence art i f icielle : mutant 13 
<400> 25 

tttgaagaaa attttttatt atttccatta ctg 

<210> 2 6 

<211> 33 

<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: mutant 14 

■:4 00> 2 6 

tttgaagaaa attttgaaga atttccatta ctg 

<210> 27 
< 2 1 1 > 33 
<212> ADN 

<213> Sequence artificielle 
<220> 

<22~> Description de la sequence a rz i f i cieile : mutant 15 
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<220> 

<223> Description de la sequence artif icielle : mutant 
<400> 28 

tttttattaa atgaattttt tgaacca-:t.a ctg 



<2:c> 29 

<211> 2 4 
<212> ADN 

<213> Sequence art if icielle 
<220> 

<223> Description de la sequence arti f iciel le : mutant 
<4 00> 2 9 

ctttttttag aattattttt attc 



<210> 30 

<211> 24 « 
<212> ADM ! 
<213> Sequence art if iciej le 

<220> 

<223> Description de la sequence artif icielle : mutant 

<400> 30 ; 
ctttttttat tattattttt attc 



<210> 31 

<211> 24 ; 
<212> ADN ■'; 

<213> Sequence artif icielle 

<220> 

<223> Description de la sequence arti f icielle : mutant 

<400> 31 

ctttttttag aagaatttga atta 



<210> 32 
«'2i:> 2 4 
<2i2> ADM 

< 2 1 3 > Sequence artificielle 
2 z j > 

<2 2 3> Description de la sequence artificielle: mutant 
<4 0C*> 32 

ct t. •. * toaaq aaaaat; :: t ca art a 
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<223> Description de la sequence art i f icielle : mutant 21 

-;co> 33 

c-.rtttgaag aattaTttga agaa 



<210> 3 4 
<-211> 15 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: mutant 22 
<4 00> 34 

ttattagaat taaat 



<210> 35 
<211> 15 
<212> ADM 

<213> Sequence artificielle 

<220> 

<223> Description de la sequence artificielle: mutant 23 
<400> 35 

ttattatttt taaat 



<210> 36 
<211> 15 
<212> ADN 

<213> Sequence arti f icielle 
<220> 

<223> Description de la sequence artificielle: mutant 24 

<400> 36 
ttagaattat taaat 



<210> 37 
< 2 1 .1 > 1 5 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: mutant 25 
-4 00- 3? 

ttattatttt ttaat 



• - . . . ~ • JO 

' - - -' ' ^cc^enc-. b. : 'Z i i ir:i-j '. \ e 

..'20> 

. r. s > r-escr i pt i c.'i ;ie la seouenco. artificielle: mutant 26 
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<400> 38 

ttagaagaat LaoaT 13 

<21G> 39 
<211> 15 
<212> ADN 

<213> Sequence artificielle 

<220> 

<223> Description de la sequence artificielle: mutant 27 
<400> 39 

ttagaaittt taaat 15 

<210> 4 0 
<211> 15 
<212> ADN 

<213> Sequence artificielle 

<220> 

<223> Description de la sequence artificielle: mutant 28 



<400> 40 

ttagaatttg aaaat 



15 



<210> 
<211> 
<212> 
<213> 



41- 

15 

ADN 



Sequence artificielle 



<220> 
<223> 



Description de la sequence artificielle: mutant 29 



<4 00> 4 1 

ttagaagaacj a a a a ti 



15 




4 2 
3 3 
ADN 



Seauence artificielle 




Description de la sequence artificielle: 

c J. i cor; *j c 1 eo t i de 1 



<4 03> 4 2 

gat co a.-: a to aca*. taaa tttaac:_cjtr gtt 



33 




. v. .L Lv^i. 




L i c n dc la secuen artificielle: 
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o 1 i g or: o c ^ oot i de 2 



•*O0-> 4 3 



s^aca t : i; ~ a 'Ltaagtgt*: gtt 



33 



<21!> 
<212> 
--21 3> 



e • r t i l i i o 1 1:. 



< J .i. .j 



■'223> >S':ripticr; de la sequence artificielle 
o 1 i q o nucleo *„ i d e 3 



<4 00> 4-i 

gatcgaaatg atacagaaaa tttaagtgtt gtt 
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<210> 45 
<211> 3 3 
<21?> ADN 

<213*> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 
oligonucleotide 4 

<400> 45 

cgaaatgata cacgattatt aagtgttgtt cgt 33 



<2 ] 0> '1 6 
<2il> 33 
<212> ADN 

< 2 1 3 > Sequence artificielle 



<220> 

<223> ;>^c;ip: ion de la sequence artificielle 

^ j i a on *. : c 1 0 c- i do 5 



<<;00> 4 6 

c q a a a <: :i a »;. a c a c q a g a a 1 1 aagtgttgtt cgt 



33 




< ^ ~ 3 > ; : '::."suor.*.:-: artificielle 



— — - " v. 



:e artificielle 



1er depot 



40 



<213> Sequence artificielle 

-'22C> 

<223> Description de la sequence artificielle 
oligonucleotide 1 

<<5C0> 4 3 

ttggctgatc gaaatgaatt tttattatta agtgttgtt 



<210> 49 
<211> 39 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle 
oligonucleotide 8 

<400> 49 

ttggctgatc gaaatgaatt attaaattta agtgttgtt 



<210> 50 
<211> 39 

<212> ADN ; 
<213> Sequence artificielle 

<220> ' 

<223> Description de la sequence artificielle 
oligonucleotide 9 

<400> 50 

ttggctgatc gaaatgaatt attattatta agtgttgtt 



<210> 51 
<211> 39 
<212> ADN 

<213> Sequence artificielle 

<220> 

<223> Description de la sequence artificielle 
oligonucleotide 10 

<400> 51 

ttggctgatc gaaatgaaga agaagaatta agtgttgtt 



ADN 

Sequence artificial le 

D-:-- script ion de la sequcr. rc a n* i f icieile 
ci i .jorvac!! eot ide 11 

ttgcictgatc gaaatgaaga attattatta agtgttgtt 



<210> 
< 2 1 3 > 
<212> 

.— 

<22 3> 



-,' "fc T 



1er depot 
41 



<210> 53 
<211> 36 
<212> ADN 

<213> Sequence art i f iciel le 
<220> 

<223> Description de la sequence artificielle 
oligonucleotide 12 

<A00> 53 

caaaattggt tggctgaatt aaatgaatta ttaaat 

<210> 54 
<211> 36 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle 
oligonucleotide 13 

<400> 54 

caaaattggt tggctgaatt aaatgaattt ttaaat 

<210> 55 
<211> 39 
<212> ADN 

<213> Sequence artificielle 

<220> 

<223> Description de la sequence artificielle 
oligonucleotide 14 

<400> 55 

caaaattggt tggctgaatt attagaattt ttattatta 

<210> 56 
<211> 39 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle 
oligonucleotide 15 

<MCO> 5 6 

caaaattggt tggctgaatt attagaatta ttattatta 
<210> 57 

< : : i > 39 

*'212> AD!-: 

'*213> Sequrrr.c~- artificielle 

~ *> "N 

<T.23> Description de la sequence artificielle 
oligonucleotide 16 



1er depot 
42 



<400> 57 

caaaattggt tggctTgaatt attagaagaa ttattatta 



<2I0> 58 
<21 1 > 39 
<212> AON 

<2 ] 3s Sequence art if iciell e 

<223> Description de la sequence artificielle 
oligonucleotide 17 

<400> 58 

caaaattggt tggctgaacg attagaattt ttattatta 



<210> 59 
<211> 39 
<212> ADN 

<213> Sequence artificielle 

<220> 

<223> Description de la sequence artificielle 
oligonucleotide 18 j 

» 

<400> 59 ■ .v 

caaaattggt tggctgaacg aftagaatta ttattatta 



<210> 60 " 
<211> 39 
<212> ADN 

<213> Sequence artificielle 

<220> ; 

<223> Description de la sequence artificielle 
oligonucleotide 19 

<400> 60 

caaaattggt tggctgaatt agaagaatta ttattatta 



's ./ , \J > £ 1 

<21I> 39 
<Z\2> ADM 

<213> Sequence artificielle 

< 2 2 0 > 

«*223> Description de la sequence artificielle 
o 1 i. s c r. u c ! e o t i d e 2 0 



1er depot 
43 



. ' *n r- 

Description de la sequence amiricieile 
oligonucleotide 2 1 

<400> 62 

g c t a t ;. c c a L ?j L l l t L a L t a a a t g g acac cacgr.r. 



<210> 63 
<211> 36 
<212> ADN 

< 2 ] 3 > jequence arc i f i ciel le 
<220> 

<223> Description de la sequence artificielle 
oligonucleotide 22 

<400> 63 

gctattccat tgtttgaaga aaatggacag caggtt 



<210> 64 
<211> 36 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle 
oligonucleotide 23 

<400> 64 

ttattaaatg gacagcagtt accattactg tcagta 



<210> 65 
<211> 36 
<212> ADN 

<213> Sequence artificielle 

-220> 

< 2 2 3 > De s c r i p c i o n d e la sequ e n c e a r t i f .i c i e .1 1 e 
oligonucleotide 2 4 

<400> 65 

Uattaaatg gacagcagtt tccat tactg tcagta 



1 er depot 
44 



67 
36 
ADM 

Sequence artificieile 



Description de ia sequence artificieile: 
oligonuci eot ide 2 6 

67 

gaagaaaa -„ :j gacagcagtt acca t t aetg t cagta 

<2IC> 68 
<211> 36 
<212> AON 

<213> Sequence artificieile 

<220> 

<223> Description de la sequence artificieile: 
oligonucleotide 27 

<400> 68 

gaagaaaatg gacagcagtt' tccattactg rcagta 

<210> 69 • % ~ 

<211> 45 . 
<212> ADN 

<213> Sequence artificieile 
<220> 

<223> Description de la: sequence artificieile: 
ol igonucleotide '28 

<400> 69 * ! 

ccattgtttt tattaaattt atttttttta ccattactgt cagta 



70 
■•4 5 
ADN 

Sequen ce a r t i f i c ie .1 \ c- 



Descript ion de la se:;:or.:e artificieile: 
o i i q orn: c 1 eo t i de 2 9 

ccatigtLtt tattaaattt agaac :■. a L v. a ccattactgt cagta 



<21 0> 
<211> 
<212> 
<213> 

<22C> 
<223; 



f» :"\ -> 



1er depot 



45 



'4 JJ> 71 

- >-.r Lg*_ L >g aagaaaattt agaa^aa t t a cca 1 1 act g t caqia 



? 1 .1 > 7 2 
<212> ADM 

< 2 " 3 > -id-qucnsvc a rLificielle 
<22C> 

<222> Description de la sequence art i f icielle : 
o 1 i gonu c 1 6o~ i d ^ 3 1 

<:.10C> 7 2 

ccatt.gtttg aagaaanltt Ittattacct ccattactgt cagta 45 

<210> 73 
<21i> 45 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 
oligonucleotide 32 



<210> 74 
<211> 45 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 
oligonucleotide 33 

<4 00> 7 4 

ccattgtttt tattaaat V.:: tgaagaattt ccattactgt cagta 45 



<400> 73 

ccattgtttg aagaaaattt 



tgaagaattt ccattactgt • cagta 



45 




ADN 

Sequence a r: i f i c i e 1 1 o 



description de la sequence artificielle: 
■* 1 igonucic-ot 1 de 34 



taztaa^tga a t *; r_ *_ 1 1 -z a a ccaztactgn cagta 



i : - 



AD? • 

Seo u e nee a r - i f i c i e 1 1 e 



1 er depot 



46 



<220> 

<22 3> Description de la sequence artif icielle 
ol igonucl^ot ide 35 

<400> 76 

gatgeatetc tttttttaga aggatgggga etc 



<2I0> '77 
<21 1> 2 6 
<212> APN 

<213> Sequence artificielle 



<220> 

<223> Description de la sequence artif icielle 
oligonucleotide 36 

<400> 77 

gatgeatetc tttttttatt aggatgggga ttcaca 

<210> 78 
<211> 33 
<212> ADN 

<213> Sequence artificielle 
<220> ' ' 

<223> Description de la sequence artificielle 
oligonucleotide 37 

<400> 78 ( 
gatgeatetc tttttgaaga aggatgggga ttc 

i 

<210> 79 j 
<211> 33 { 
<212> ADN 

<213> Sequence artificielle 

<220> 

<2 2 3> Description de la sequence artificielle 
ol igonucleot ide 33 

<400> 79 

tragaaggat ggggatLaac acagggggaa att 



<210> 3 0 
<211> 33 
<2I2> ADN 

< 2 1 3 > ?eci:cnco artificielle 



^ o "> 

<- *> y "> rv*. - •' * > 



da la 



s c- 3m •: r. r e artificielle 



c ] l-jo:vk: : eo: i de 



1er depot 



47 

<211> 45 * 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artif icielle : 
oligonucleotide 4C 

<400> 81 

gcatctcttt ttttagaatt atttttattc acacaggggg aaatt 

<210> 82 
<211> 4 5 
<212> AON 

<213> Sequence artificielle 

<220> 

<223> Description de ia sequence artificielle: 
oligonucleotide 41 

<400> 82 

gcatctcttt ttttattatt atttttattc acacaggggg aaatt 

<210> 83 

<211> 45 

<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 
oligonucleotide 42 

<400> 83 

gcatctcttt ttttagaatt atttttattc acacaggggg aaatt 

<210> 84 
<211> 45 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 
oligonucleotide 43 

<4 00> 8 4 

gcatctcttt ttgaagaatt atttttattc acacaggggg aaatt 

<2i0> 8 5 

< 2 1 ! > 4 5 

<2 12 • .~ON 

<Z 1 3 ^ Sequence artificielle 
_ ^ j • 

<2..;-..- !'cs:ric- ion de la sequence artificielle: 
J5 1 i qonuc 1 eo tide 4 4 



1 er depot 



48 



catctcttt ttgaaqaatt atttttagaa acacaggggg aaatt 



<210> 86 
<211> 39 
<212> ADN 

<213> Sequence artif icielle 
<220> 

<223> Description de la sequence artif icielle : 
oligonucleotide 4 5 

<400> 86 

ggtttagatc gtttattaga attaaatact gaaagttgg 



<210> 87 

<211> 39 

<212> ADN 

<213> Sequence artificielle 

<220> 

<223> Description de la sequence artificielle: 
oligonucleotide 46 

<400> 87 

ggtttagatc gtttattatt • tttaaatact gaaagttgg 



<210> 88 " U 

<211> 39 
<212> ADN 

<213> Sequence artificielle 

» 
i 

<220> * 

<223> Description de la, sequence artificielle: 
oligonucleotide 4*7 

<400> 88 

ggtttagatc gtttagaatt attaaatact gaaagttgg 



<210> 89 
<211> 3 9 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Descript ior. de la sequence artificielle: 
oligonucleotide 4 8 

<400> 89 

ggtttagatc gtutattatt ttttaalact gaaagttgg 



<210> i-C 
<2ll> 3 9 



1er depot 



49 

<223> Description de la sequence artificielie 
oligonucleotide 40 

<noo> 90 

ggtttagatc gtttagaaga attaaatact gaaagttgg 

<210> 91 
<211> 39 
<212> ADW 

<213> Sequence artificielie 
<220> 

<223> Description de la sequence artificielie 
oligonucleotide 50 

<400> 91 

ggtttagatc gtttagaatt tttaaatact gaaagttgg 

<210> 92 
<211> 39 
<212> ADN 

<213> Sequence artificielie 

<220> 

<223> Description de la sequence artificielie 
oligonucleotide 51 

<400> 92 

ggtttagatc gtttagaatt tgaaaatact gaaagttgg 

<210> 93 
<211> 39 
<212> ADN 

<213> Sequence artificielie 
<220> 

<223> Description de la sequence artificielie 
oligonucleotide 52 

<400> 93 

ggtttagatc gtttagaaga agaaaatact gaaagttgg 

<210> 94 
<211> 3C 
<212> ADM 

<213> Sequence artificielie 



1er depot 



50 



<212> ADN 



<2*3> Sequence arti f icicllo 



<220> 

<22 3> Description de la sequence artificielle 
oligonucleotide 54 

<<100> 9b 

tgggtgtcca tcagaagaag aattaaggt a ccctttggca 



<210> 


96 




<211> 


27 




< 2 1 2 > 


ADN 




<213> 


Sequen ce a r t i f .1 c 


i e .1 3 e 


<220> 






<223> 


Description de 1 


a sequence 




oligonucleot ide 




<400> 


96 




tcctttggca agtgaaccaa 


atgcagc 


<210> 


97 




<211> 


25 




<212> 


ADN 





<213> Sequence artificielle 

■ » 

<220> 

<223> Description de la sequence artificielle 
oligonucleotide >56 



<400> 


97 


gaacta taaa 


< 2 1 0 > 


98 


<211> 


2 6 


< 2 1 2 > 


ADN 


<213> 


Sequ 


<22C> 




<223> 


Desc 




ol ig 


<4 00> 


o.-p. 



1er depot 
51 



-21'^ *00 
<2i:> 36 
<2\?:> ADN 

<2!3> Sequence artif icielle 



' "• ^ 

<22?> Description de In s^qjence artificielle 
celiac nuc «*-or i die 59 

<4 00> IOC 

ta 1 1* acjtggt agaaaaqcat t-jcaoac^qc gcttac 



<210> 101 
<211> 37 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de La sequence artificielle 
oligonucleotide 60 

<4 00> 101 

cagactgcgc ttactgttat tagggagaat actcggg 



<210> 102 
<211> 25 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de La sequence artificielle 
oligonucleotide 61 

<400> 102 

gggctttagg 1 1 1 a c c y 1 1 1 t c t g g 



<2I0> 103 
<211> 26 
<212> ADN 



<"2i:-'- Sequence ar^iiicieli* 



9 O r. 



<2^:>> Description de la sequence artificielle 

o i i a o n jC: 6 c t i d e 5 P 



1er depot 



52 



oligonucleotide 63 
<400> 104 

cttttaaata cactgtttcc attaaatgaa acagctatat 



<210> 105 
<211> 24 
<212> ADN 

<213> Sequence artificielie 
<220> 

<223> Description de la sequence artificielie: 
oligonucleotide 64 

<400> 105 

acagctatat ttgaagcttt catg 



<210> 106 
<211> 26 
<212> ADN 

<213> Sequence artificielie 
<220> 

<223> Description de la sequence artificielie 
oligonucleotide 65 

1 V 

" / 

<400> 106 '[ 
ctttcatgcg acagttagag gaacttj 

» 

i 

<210> 107 . ^ 

<211> 26 "' 
<212> ADM v ? 
<213> Sequence artificielie j 

<220> i; 

<223> Description de la sequence artificielie 
o] iqonucleotide 66 

<4 00> 107 

qaggaacttt taaatcaaca aataac 



<210> 108 
<211> 2i 
<212> ADN 

<2.13> Sequence artificielie 
<220> 

<223> Description de la sequence artificiell 
r. ' .uior.u elect ide 67 



1 er depot 

53 



36 ouencc- ari! z i c 5 e 1 L e 



2 f ' > 



>;5cripr.ior: de la sequence artificielie 
i -jonu^Ioot ide 63 



! : v* ■ '. zt a ': t t a i: * t ca a eg - r. c 



23 



■ 1 2 



v. i f i c i e 1 1 e 



< 2 2 0 > 



<22 3> Description de la sequence 


artificielie : 




c 1 1 q on u c 1 e o t i d e 69 






<400> 110 






ccitcnaaat tttttggctg a 




21 


<.-::o> in 






<2j1> 17 






<212> ADN 






<213> Sequence artificielie 






<220> 






<223> Description de la sequence 


artificielie : 




oligonucleotide 70 






<4C0> 111 






ttggctqaac q a a a t g a 




17 


<2:o> -12 






< 2 : : > ?. 3 






<"2!2> A ON 






</] %> Sequence artificielie 






- n > 






•:223> Description de la sequence 


artificielie : 




o 1 i g o nuci e o t i d e 7 1 






A *■» — ■» 






c o c3 ci a t c a a a cacgaaattt aaq 




23 


■ 1 X C .'■ 1 ] 3 

* • * * 

API: 






-. ■ ' ", . » !'">'* *^ : "* O - — ' f i ; ' ' ■ ' 1 ^ 

* 






* . " : r*-. ~ i r r. 1 . =: sC .v.:c n.re 


a rt i f i cie! le : 










: ' j 

31 -.I" t :) d .1 1 t t :1 1 L H I TjC 1 C ^ 5 


1 1 - a t a a 


— * 



1er depot 
54 



<210> 114 
<211> 4 8 
<212> AON 

<2]3> Sequence artificielle 
<220> 

<"223> Description de la sequence art i f icielle : 
oligonucleotide 73 

<4 00> 114 

gctcaattta tagctttaga acttqaattt ttaaatgcta ttccattg 



<210> 115 
<211> 27 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 
oligonucleotide 74 

<400> 115 

ccattgtttg cattaaatgg acagcag 



<210> 116 

<211> 27 ; ; 

<212> ADN 

<213> Sequence artificielle 
<220> ■ 

<223> Description de la sequence artificielle: 
oligonucleotide 75 \ 

<400> 116 

ccattgtttg cattaaatgg acagcag 



<210> 117 
<211> 27 
<212> ADN 

<213> Sequence artificielle 
<220> 

<22 3> Description de la sequence artificielle: 
oligonucleotide 7 6 

<400> 117 

ccattactgt cattatatoc icaagct: 



<210> 118 
<211> 2 7 
■:212> ADN 



1 er depot 

55 



r -j t- 



r t. i.-} ;j t - t a C is r . t. ■ - 



< 21 C> 
•".111 



11 0 



r. _ 



•'PI 1 % 



"esor j \. \ i o M l ^ c^n :o a r t i f ici e l le : 



-i r t a a a a g a a o c a I. r; «: c '.: t *: r. 



--2 3.C > 120 

<2I1 > 25 

<2I2> ADN 

< 2 .1 3 > Sequence a r L i f i c i e j I e 

- ; ; ;■ > 

■*.22 3> Description do la sequence artif icielle : 
oligonucleotide 7 9 

-400> 120 

tggagaagga 1 1 tgga t tea cacag 



<210> 121 

<211> 2 4 

<212> ADN 

< 2 1 3 > S e qu o n c o a r i: i f L c i e I 1 e 
<220> 

<~'A3> Rescript de la sequence art i f icielle : 
oligorra ^Ir-or : d«r SO 



( * a c a L a r. t a *_ 



2 4 




S «■!* o *j e : i r' e -j r t j ;7 L c i e 1 1 e 



1 1 



■ r 



ar tif icielle : 




i : 



1 er depot 
56 



<220> 

<223> Description de la sequence artif icielle : 
oligonucleotide 82 

<400> 123 

tacaggttta qaacgtttaa gagga 



<210> 124 
<211> 28 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: 
oligonucleotide 83 

<400> 124 

aatactgaaa gttttttaag atatcatc 



<210> 125 
<211> 51 
<212> ADN 

<213> Sequence artificielle. 

» 

<220> • ; 

<223> Description de la sequence artificielle: 
oligonucleotide 84 '? 

< 

<400> 125 

gtagagaaat gactttatta ttattagaat tattagcgct atttccatat 

• I 

<210> 126 . j 

<211> 27 : \ 

<212> ADN V 
<213> Sequence artificielle 

<220> 

<223> Description de la sequence artificielle: 
oligonucleotide 8 5 

<400> 126 

atattatgaa ttacgacttt atccaac 

<210> 127 

<211> 23 

<212> ADN 

<213> Sequence artificielle 
<22C> 

<223> Description de la sequence artificielle: 
o 1 i o nu c 1 e o tide 86 

<400> 111 

cttacacqtc actuate tac aga 



1er depot 
57 



<210> 128 

<211> 29 

<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle 
ol ioonucleot ide 87 

<40C> 128 

tatacagaar cgattttatt taatccacc 

<210> 129 

<211> 28 

<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle 
oligonucleotide 88 

<400> 129 

ccaccagcta atttaggact ttgccgac 

<210> 130 
<211> 27 
<212> ADN 

<213> Sequence artificielle 

<220> 

<223> Description de la sequence artificielle 
oligonucleotide 89 

<400> 130 

ctttgccgac gttttggtac taatccc 

<210> 131 
<211> 23 
<212> ADN 

<213> Sequence artificielle 

<220> 

<223> Description de la sequence artificielle 
oligonucleotide 90 

<400> 121 

catctttttg aaaqgctgaa tag 



1er depot 
58 



<400> 132 

taatcgattt ccattatcat ctaattttat 



<210> 133 
<211> 36 
<212> ADN 

<213> Sequence artif icielle 
<220> 

<223> Description de la sequence artif icielle 
oligonucleotide 92 

<400> 133 

ctaattttat ggaatatttt tcaggacata cgttac 



<210> 134 
<211> 33 
<212> ADN 

<213> Sequence art if icjlelle 
<220> ; 

<223> Description de la sequence artificielle 
oligonucleotide' ^3 

<400> 134 • 

tagttatctg aacgaatcag /teattacaaga aga 

<210> 135 
<211> 20 

<212> ADN > 
<213> Sequence artificielle 

i 

<220> \ 

<223> Description de la sequence artificielle 
oligonucleotide 94 

<400> 135 

caagaagaaa gttatggcct 



<210> 136 
<211> 35 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle 
oligonucleotide 95 

<4C0> 136 

caattaatcc rrggattagaa ggaacaaacc gcata 

<21G> 137 
<2I2> ADN 

<213> Sequence .artificielle 



1er depot 



59 

<220> 

<223> Description de la sequence artificielle 
oligonucleotide 96 

<400> 137 

gagtcaacgg cattagaatt tcgttctgca 



<210> 138 
<21 1> 26 
<212> ADN 

<213> Sequence artificielle 

<220> 

<223> Description de la sequence artificielle 
oligonucleotide 97 

<400> 138 

ggtatatatg gcttaaatag agcttc 



<210> 139 
<211> 30 
<212> ADN 

<213> Sequence artificielle 

<220> 

<223> Description de la sequence artificielle 
oligonucleotide 98 

<400> 139 

tagagcttct tttttaccag gaggcttgtt 



<210> 140 
<211> 31 
<212> ADN 

<213> Sequence artificielle 
<220> 

<22 3> Description de la sequence artificielle 
oligonucleotide 99 

<400> 140 

ctgctaatgg aggatgtaga gaactctatg a 



<2i0> 14 1 
<211> 17 
<212> ADM 

<?\ 3> Sequence artificielle 
<2J":> 

''.;.'!.?-■ jo^criciion de la sequence artificielle 
ci iqr- nucleotide 100 



da mes***"* 



1er depot 
60 



<211> 20 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle 
oligonucleotide 101 

<400> 142 

acaaatgaag aattaccacc 



<210> 143 
<211> 27 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle 
oligonucleotide 102 

i 
< 

<400> 143 ) 
attaccacca gaagaaagta ccgfgaag 



<210> 144 ■ • ; 

<211> 30 - S-i 



<212> ADN 
<213> Sequence artificielle 

s' 

V 

<220> I 

<223> Description de la sequence artificielle 
oligonucleotide 103' 

<400> 144 • \ 

agactatctc atttaacctt ttt^tagcttt 



<210> 145 i 
<211> 27 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle 
oligonucleotide 104 

<400> 145 

gctaatgcag gaagtttacc tacttat 



<210> 146 
<211> 26 
< 2 1 2 > ADN- 

<2I3> Sequence ami t icielle 
s - 2 n > 

< 2 Z 3 > Description de ia sequence artificielle 
ol i GcnucieoL ide 105 



<4 0C> 146 



1 er depot 



61 



cctacttatt tatttacccg tcgtga 

<210> 147 
<211> 33 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle 
oligonucleotide 106 

<400> 147 

acccgtcgtg aattagaact taataatacg att 

<210> 148 
<211> 24 
<212> ADN 

<213> Sequence artificielle 
<220> ■ • 

<223> Description de la sequence artificielle 
oligonucleotide 107 

<400> 148 • 
attaccattg ttaaaggcat ct : gc 

* 

<210> 149 
<211> 30 
<212> ADN 

<213> Sequence artificielle 

' f 

<220> 

<223> Description de la 'sequence artificielle 
oligonucleotide 108 

<400> 149 

aaggcatctg cacctttatc gggtactacg 

<210> 150 
<211> 29 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle 
oligonucleotide 109 

<400> 150 

tcgggtacta cgttattaaa aggtccagg 

<210> 151 
<211> 40 
< 2 1 2 > ADN 

<213> Sequence artificielle 



<220> 



1er depot 
62 



<223> Description de la sequence artif icielle : 
oligonucleotide 110 

<400> 151 

acatttggaa cgttaagatt aacgttaaat tcaccattaa 



<210> 152 
<211> 37 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle 
oligonucleotide -111 

<400> 152 

cacaacaata tcgcctaaga ttacgttttg cctcaac 



<210> 153 

<211> 31 . '§ 

<212> ADN \ 
<213> Sequence artificielle 

- •* 

<220> ['); 

<223> Description de la sequence artificielle 
oligonucleotide) 112 

<400> 153 . 

aaatttcagt at aaggttac jtccgtggagg g 



<210> 154 * 
<211> 35 j 
<212> ADN | 
<213> Sequence artificielle 

<220> 

<223> Description de la sequence artificielle 
oligonucleotide 113 

<400> 154 

ataagggtac tccgtggagg gttatctatc ggtga 



<210> 155 
<211> 29 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle 
oligoni-jci eo* ide 114 

<400> 155 

tctatcggtg aattaagatt aggqagcac 



<210> 156 
<211> 30 



1er depot 



63 

<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle 
oligonucleotide 115 

<400> 156 

caagagattc taacattaaa tgcagaaggt 

<210> 157 

<211> 32 

<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle 
oligonucleotide 116 

<400> 157 

aatgcagaag gtttaagcac cggtggtgaa ta 

<210> 158 
<211> 32 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle 
oligonucleotide 117 

<400> 158 

gtggtgaata ttatatagaa agaattgaaa tt 

<210> 159 
<211> 37 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle 
oligonucleotide 118 

<400> 159 

agaattgaaa ttttaccttt aaatccggca cgagaag 

<210> 160 
<211> 30 
<212> ADN 

<213> Sequence artificielle 

<220> 

<223> Description de la sequence am i ficielle 
oligonucleotide ; }9 



<A0O> 160 

cgagaagcgg aagaggaatt aqaagcggcg 
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